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(54) Bezeichnung: VERFAHREN ZUR EXPRESSION VON BIOSYNTHESEGENEN IN PFLANZLICHEN SAMEN UNTER 
VERWENDUNG VON NEUEN MULTIPLEN EXPRESSIONSKONSTRUKTEN 

(57) Abstract: The invention relates to expression cassettes, combinations thereof and vectors containing said expression cassettes, 
containing plant promoters with an expression specificity for plant seeds, in particular linseed and the use of said expression cas- 
settes or vectors for the recombinant expression of heterologous genes in plants. The invention further relates to transgenic plants, 
transformed by means of said expression cassettes, or vectors, cultures, parts or transgenic propagations derived therefrom and the 
use of the above as foodstuff, animal feedstuff, seedstuff, pharmaceuticals, fine chemicals or industrial raw material. 

(57) Zusammenfassung: Die Erfindung betrifft Expressionskassetten, deren Kombination und Vektoren enthaltend die Expressi- 
onskassetten, die pflanzliche Promotoren mit einer Expressionsspezifitat fiir pflanzliche Samen insbesondere Leinsamen enthalten, 
sowie die Verwendung dieser Expressionskassetten oder Vektoren zur rekombinanten Expression heterologer Gene in Pfianzen. 
Die Erfindung betrifft femer mit diesen Expressionskassetten oder Vektoren transformierte transgene Pfianzen, davon abgeleitete 
Kulturen, Teile oder transgenes Vermehrungsgut, sowie die Verwendung derselben als Nahmngs-, Futtermittel oder Saatgut, Phar- 
mazeutika, Feinchemikalien oder als industrieller Grundstoff. 
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Verfahren zur Expression von Biosynthesegenen in pflanzlichen Sa- 
men unter Verwendung von neuen multiplen Expressionskonstrukten 

5 Besciireibung 

Die Erfindiing betrifft Expressionskassetten, deren Kombination 
und Vektoren enthaltend die Expressionskassetten, die pflanzliche 
Promotoren mit einer Expressionsspezif itat fiir pflanzliche Samen 

10 insbesondere Leinsamen enthalten, sowie die Verwendung dieser Ex- 
pressionskassetten Oder Vektoren zur rekombinanten Expression he- 
terologer Gene in Pflanzen. Die Erfindung betrifft ferner mit 
diesen Expressionskassetten oder Vektoren transf ormierte trans- 
gene Pflanzen, davon abgeleitete Kulturen, Telle oder transgenes 

15 Vermehxungsgut, sowie die Veirwendung derselben als Nahrungs-, 
Futtermittel oder Saatgut, Pharmazeutika, Feinchemikalien oder 
als industrieller Grundstoff. 

Die erf indungsgeitiaSen Expressionskassetten werden vorteilhaft in 

20 einem Verfahren zur Herstellung von ungesattigten Fettsauren mit 
mindestens zwei Doppelbindungen und/ oder ein Verfahren zur Her- 
stellung von Triglyceriden mit erhohtem Gehalt an mehrfach unge- 
sattigten Fettsauren mit mindestens zwei Doppelbindungen verwen- 
det , Im Verfahren f inden vorteilhaft die Nukleinsaureseqiaenzen 

25 SEQ ID NO: 1, SEQ ID NO : 3, SEQ ID NO : 5 oder 11 Anwendung, die 
unter Verwendung der Expressionskassetten exprimiert werden. 
Diese vorgenannten Nukleinsauren sind im Verfahren sowie zur Her- 
stellung eines transgenen Organismuses bevorzugt einer transgenen 
Pflanze oder eines transgenen Mikroorganismus mit erhohtem Gehalt 

30 an Fettsauren, Olen oder Lipiden mit ungesattigten Cis-, C20"/ 

Oder C22-Fettsauren geeigriet. AuSerdem konnen mit Hilfe der erfin- 
dungsgemalSen Expressionskassetten weitere Gene neben den Nuklein- 
sauresequenzen SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 und 
SEQ ID NO: 11 oder seine Homologen, Derivate oder Analoga sowie 

35 Genkonstrukte, die diese Gene oder ihre Homologen, Derivate oder 
Analoga umfasst, sowie Ihre Verwendung allein oder in Kombination 
mit weiteren Biosynthesegenen bevorzugt Biosynthesegene fiir poly- 
ungesattigter Fettsauren, wie vorteilhaft in SEQ ID NO: 7 und SEQ 
ID NO: 9 dargestellt, in Organismen bevorzugt Pflanzen exprimiert 

40 werden. 

Eine Reihe von Produkten und Nebenprodukten naturlich vor- 
kommender Stof fwechselprozesse in Mikroorganismen, tierischen 
und pflanzlichen Zellen sind fiir viele Indus triezweige, ein- 
45 schlieSlich der Futtermittel-, Nahrungsmittel- , Kosmetik- und 
pharmazeutischen Industrie, nutzlich. Zu diesen gemeinsam als 
"Feinchemikalien" bezeichneten Molekiilen gehoren beispielsweise 
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Lipide und Fettsauren, unter denen eine beispielhaf te Klasse 
die mehrfach ungesattigten Fettsauren sind. Fettsauren und Tri- 
glyceride haben eine Vielzahl von Anwendungen in der Lebens- 
mittelindustrie, der Tierernahrung, der Kosmetik und im Pharma-^ 
5 bereich. Je nachdeiti ob es sich urn freie gesattigte oder unge- 
sattigte Fettsauren oder unx Triglyceride niit einem erhohten 
Gehalt an gesattigten oder ungesattigten Fettsauren handelt, sind 
sie fur die unterschiedlichsten Anwendungen geeignet, so werden 
beispielsweise mehrfach ungesattigte Fettsauren (polyunsaturated 
10 £atty avoids / PUFAs) Babynahrung zur Erhohung des Nahirwertes 
zugesetzt. PUFAs haben weiterhin einen positiven Einfluss auf 
den Cholesterinspiegel im Blut von Menschen und eignen sich 
daher zvna Schutz gegen Herzkrankheiten . So finden sie in ver- 
schiedenen diatischen Lebensiaitteln oder Medikamenten Anwendung. 

15 

Besonders geeignete Mikroorganismen zur Herstellung von PUFAs 
sind Mikroorganismen wie Thraustochytrien oder Schizochytrien- 
Stamme/ Al gen wie Phaeodactyliim tricornutum oder Crypthecodiniiam- 
Arten, Ciliaten, wie Stylonychia oder Colpidium, Pilze, wie 

20 Mortierella, Entomophthora oder Mucor. Durch Stammselektion 
ist eine Anzahl von Mutantenstammen der entsprechenden Mikro- 
organismen entwickelt worden, die eine Reihe wunschenswerter 
Verbindungen , einschlieSlich PUFAs, produzieren. Die Selektion 
von Stammen mit verbesserter Produktion eines bestimmten Molek\ils 

25 ist jedoch ein zeitraubendes und schwieriges Verfahren. 

Alternativ kann die Produktion von Feinchemikalien geeigneter- 
weise iiber die Produktion von Pflanzen, die so entwickelt sind, 
dass sie die vorstehend genannten PUFAs herstellen, im groSen 

30 MaSstab durchgefuhrt werden, Besonders gut fiir diesen Zweck 
geeignete Pflanzen sind Olfruchtpf lanzen, die groiSe Mengen an 
Lipidverbindungen enthalten wie Raps, Canola, Lein, Soja, Sonnen- 
blumen, Borretsch \md Nachtkerze. Aber auch andere Nutzpf lanzen, 
die Ole oder Lipide und Fettsauren enthalten, sind gut geeignet, 

35 wie in der eingehenden Beschreibung dieser Erfindung erwahnt. 
Mittels herkommlicher Zuchtung ist eine Reihe von Mutanten- 
pf lanzen entwickelt worden, die ein Spektrum an wiinschenswerten 
Lipiden und Fettsauren, Cofaktoren und Enzymen produzieren. 
Die Selektion neuer Pf lanzensorten mit verbesserter Produktion 

40 eines bestimmten Molekiils ist jedoch ein zeitaufwandiges und 

schwieriges Verfahren oder sogar unmoglich, wenn die Verbindung 
in der entsprechenden Pflanze nicht naturlich vorkommt, wie im 
Fall von mehrfach ungesattigten Cis"/ C20~Fettsauren und C22-Fett- 
sauren und solchen mit l&ageren Kohlenstof f ketten. 
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Aufgrund der positiven Eigenschaf ten ungesattigter Fettsauren 
hat es in der Vergangenheit nicht an Ansatzen gefehlt. Gene, 
die an der Synthase von Fettsauren bzw. Triglyceriden beteiligt 
sind, fur die Herstellung von Olen in verschiedenen Organismen 
5 mit geandertem Gehalt an ungesattigten Fettsauren verfugbar 
2u machen. So wird in WO 91/13972 und seinem US-Aquivalent 
eine A-9-Desaturase beschrieben. In WO 93/11245 wird eine 
A~15-Desaturase in WO 94/11516 wird eine A~12-Desaturase bean- 
sprucht. A-6~Desaturasen werden in WO 93/06712, US 5,614,393, 

10 WO 96/21022 und WO 99/27111 beschrieben. Weitere Desaturasen 
werden beispielsweise in EP-A-0 550 162, WO 94/18337, 
WO 97/30582, WO 97/21340, WO 95/18222, EP-A-0 794 250, Stukey 
et al., J. Biol. Chem., 265, 1990: 20144-20149, Wada et al . , 
Nature 347, 1990: 200-203 oder Huang et al . , Lipids 34, 1999: 

15 649-659 beschrieben. In WO 96/13591 wird eine A-6-Palinitoyl- 
ACP-Desaturase beschrieben und beansprucht. Die biochemische 
Charakterisierung der verschiedenen Desaturasen ist jedoch bis- 
her nur unzureichend erfolgt, da die Enzyme als membrangebundene 
Proteine nur sehr schwer zu isolieren und charakterisieren sind 

20 (McKeon et al . , Methods in Enzymol . 71, 1981: 12141-12147, 
Wang et al . , Plant Physiol. Biochem. , 26, 1988: 777-792). 

In Hefen konnte sowohl eine Verschiebung des Fettsaurespektrums 
zu ungesattigten Fettsauren hin als auch eine Steigerung der 

25 Produktivitat nachgewiesen werden (siehe Huang et al.. Lipids 34, 
1999: 649-659, Napier et al . , Biochem. J., Vol. 330, 1998: 
611-614) . Die Expression der verschiedenen Desaturasen in trans- 
genen Pflanzen zeigte allerdings nicht den gewtinschten Erfolg. 
Eine Verschiebung des Fettsaurespektrum zu ungesattigten Fett- 

30 sauren hin konnte gezeigt werden, gleichzeitig zeigte sich aber, 
dass die Syntheselei stung der transgenen Pflanzen stark nachlieS, 
das heiiSt gegenuber den Ausgangspf lanzen konnten nur geringere 
Mengen an Olen isoliert werden. 

35 Weder in Hefen noch in Pflanzen werden natiirlicherweise mehr- 
fach ungesattigte C20"" und/oder C22~F^ttsauren mit mindestens 
zwei Doppelbindungen im Fettsauremolekul wie Arachidonsaure 
(ARA) und/oder Eicosapentaensaure (EPA) und/oder Docosahexaen- 
saure (DHA) hergestellt . 

40 

Nach wie vor besteht daher ein grower Bedarf an neuen Genen, 
die fur Enzyme kodieren, die an der Biosynthese ungesattigter 
Fettsauren beteiligt sind und es ermoglichen, diese in einem 
technischen MaSstab herzustellen. Keines der bisher bekannten 
45 biotechnologischen Verfahren zur Herstellimg von mehrfach 
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ungesattigten Fettsauren liefert die vorgenannten FettsS.uren 
in wirtschaf tlich nutzbaren Mengen. 

Bei der Expression von Genen in Pflanzen gibt es iininer wieder 
5 Probleme, dass heii2.t es koinint durch die Expression nicht zur er- 
warteten Steigerung bei der Herstellimg des gewiinschten Wertpro- 
dukts . 

Verschiedene Methoden zum Einschleusen von Genen in das Genom von 
10 Pflanzen sind bekannt (Halford NG, Shewry PR, Br. Med. Bull., 

2000; 56: 62-73). Ziel ist die Herstellung von Pflanzen mit vor- 
teilhaften, neuen Eigenschaf ten, zuiti Beispiel zur Steigerung der 
landwirtschaf tlichen Produktivitat , zur ' Qualitatssteigerung bei 
Nahrungsmitteln oder zur Produktion bestimmter Chemikalien oder 
15 Pharmazeutika (Dunwell JM, J. Exp. Bot., 2000: 51 Spec No: 
487-96) . 

Eine Grundvoraussetzung fur die transgene Expression bestimmter 
Gene ist die Bereitstellung pf lanzenspezif ischer Promotoren. Pro- 

20 motoren sind wichtige Werkzeuge in der Pf lanzenbiotechnologie, ura 
die Expression eines bestimmten Gens in einer transgenen Pflanze 
lokal und zeitlich zu steuern und so bestimmte Wesensmerkmale der 
Pflanze auszunutzen bzw. erst zu erzielen. Verschiedene Promoto-- 
ren fiir diverse Pf lanzenarten, bestimmte Pf lanzengewebe und Ent- 

25 wicklungsstadien sind bekannt. 

Verwendet werden zum Beispiel konstitutive Promotoren wie der 
Promoter der Nopal insynthase aus Agrobacterium, der TR-Doppelpro- 
motor Oder der Promotor des 35S-Transkriptes des Bltmenkohlmo- 

30 saikvirus (CaMV) (Odell et al., Nature 1985: 313,810-812), der 
OCS (Octopin Synthase) Promotor aus Agrobacterium, der Ubiqn-iitin 
Promotor (Holtorf S et al . , Plant Mol . Biol. 1995, 29:637-646), 
die Promotoren der vakuolarer ATPase Untereinheiten oder der Pro- 
motor eines prolinreichen Proteins aus Weizen (WO 91/13991) . 

35 Nachteilig bei diesen Promotoren ist, dass sie in fast alien Ge- 
weben der Pflanze konstitutiv aktiv sind. Eine gezielte Expres- 
sion von Genen in bestiimaten Pf lanzenteilen oder zu bestimmten 
Entwicklungszeitpunkten ist mit diesen Promotoren nicht moglich. 

40 Promotoren, deren Aktivitat gewebsspezif isch oder entwicklunsgab- 
hangig reguliert ist, wurdeh isoliert. Spezifitaten sind fiir die 
Anther en, Ovarien, Bliiten, Blatter, Stengel, Wurzeln und Samen 
beschrieben. Die Stringenz der Spezifitat, als auch die Expres- 
sions aktivitat dieser Promotoren ist sehr unterschiedlich. Zu 

45 nennen sind Promotoren, die eine blattspezif ische Expression ge- 
wahrleisten, wie der Promotor der cytosolischen FBPase aus Kar- 
toffel (WO 97/05900), der SSU Promotor (small subunit) der Rubi- 
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SCO (Ribulose-1, 5-bisphospliatcarboxylase) oder der ST-LSI Promo- 
tor aus Kartoffel (Stockhaus et al . , EMBO J. 8 (1989), 2445 - 
245) . 

5 Weitere Promotoren sind beispielsweise spezifische Promotoren fiir 
Knollen, Speicherwurzeln oder Wurzeln, wie beispielsweise der Pa- 
tatin Promotor Klasse I (B33), der Promotor des Cathepsin D Inhi- 
bitors aus Kartoffel, der Promotor der Starke Synthase (GBSSl) 
Oder der Sporamin Promotor, f ruchtspezif ische Promotoren, wie 

10 beispielsweise der f ruchtspezif ische Promotor aus Tomate (EP-A 
409625) , fruchtreifungspezif ische Promotoren, wie beispielsweise 
der fruchtreifungspezif ische Promotor aus Tomate (WO 94/21794) , 
blutenspezif ische Promotoren, wie beispielsweise der Phytoen-Syn- 
thase Promotor (WO 92/16635) oder der Promotor des P-rr Gens (WO 

15 98/22593) . 

Eine Variation der Aktivitat eines Promotoren anhangig vom Ent- 
wicklungsstadium der Pflanze wurd unter anderem von Baerson et 
al. beschrieben (Baerson SR, Lamppa GK. Plant Mol Biol. 
20 1993;22 (2) :255-67) . 

Samenspezif ische Promotoren sind aufgrund der Bedeutung des Sa- 
mens als eine der Hauptnahrungs- bzw. Futterquellen von Mensch 
und Tier und als Produktionsort fur Wertstoffe von besonderen In- 

25 teresse. Bekannt sind Promotoren, die eine Expression in Samen 
und pflanzlichen Embryonen steuern. So wurden beispielsweise die 
Promotoren von Genen identif iziert , die fiir Speicherproteine ver- 
schiedener Dicotyledonen kodieren. Samenspezif ische Promotoren 
sind zum Beispiel der Promotor des Phaseolins (US 5504200, Bustos 

30 MM et al.. Plant Cell. 1989; 1 (9) : 839-53 ) , des 2S Albumingens (Jo- 
sef f son LG et al., J Biol Chem 1987, 262:12196-12201), des Legu- 
mins (Shirsat A et al., Mol Gen Genet. 19 89 ; 215 ( 2 ) : 32 6-331 ) , des 
USP (unknown seed protein; Baumlein H et al . , Molecular & General 
Genetics 1991, 225 (3) : 459-67) des Napin Gens ( Stalberg K, et 

35 al., L. Planta 1996, 199:515-519), des Saccharosebindeproteins 
(WO 00/26388) oder der LeB4-Promotor (Baumlein H et al . , Mol Gen 
genet 1991, 225: 121-128). Diese steuern eine hohe samenspezif i- 
sche Expression von Speicherproteinen. 

40 Trotz der allgemeinen Annahme, dafi pflanzliche Promotoren von ei- 
ner Spezies auf die andere Ubertragbar sind und auch in artfrem- 
den Pf lanzenspezies ahnliche Aktivitaten "und Spezifitaten aufwei- 
sen, mehren sich Hinweise auf Einschrankungen von dieser Annahme . 
So zeigte es sich, daS die Hohe der transgenen Expression von he- 

45 terologen Genen unter Kontrolle dieser Promotoren, oft stark von 
der Art der Wirtspflanze abhangig ist. Es wurde f estgestellt , 
dass die Expression nicht immer absolut zelltypspezif isch ist. 
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Unterschiede im Expressionsmuster und der Expressionsstarke eines 

bestimmten Promoters konnen durch unterschiedliche Wirtspf lanzen 
Oder durch unterschiedliche Insertionsorte in das Genom der 
Wirtspf lanze bedingt sein (Goossens A et al . , Plant Phys 1999, 
5 120:1095-1104) . 

Durch eine Genexpression in anderen Pf lanzenteilen kann die Ver- 
wendung eines Promoters in einer anderen Pflanzenart sehr einge- 
schrankt sein. Etwa wenn die Expression des Genes in den Metabo- 
10 lisinus der Zelle, die Zusammensetzung der Membranlipide oder die 
Biosynthese eingreif t . 

Es bestand daher die Aufgabe weitere Expressionskassetten fur die 
Expression in Pf lanzen zur Verfiigung zu stellen. Und diese fur 

15 die Expression von Genen vorteilhaft Biosynthesegenen allein oder 
gegebenenf alls in Kombination mit anderen Enzymen in einem 
Verfahren beispielsweise zur Herstellung mehrfach ungesattigter 
Fettsauren zu verwenden. Diese Aufgabe wurde durch die erfin- 
dungsgemaSen Expressionskassette mit einer Struktur ausgewahlt 

20 aus der Gruppe gelost: 

a) LI - Promoter - Strukturgen - 1^2, 

b) LI - Promoter - Strukturgen - L2 - LI - Promoter - Struktur- 
25 gen - L2 , 

c) LI - Promoter - Strukturgen - L2 - LI - Promoter - Struktur- 
gen - L2 - Ll - Promoter - Strukturgen - L2, 

30 wobei Ll, L2 , Prometor und Strukturgen die felgende Bedeutung 
hat : 

Ll = SEQ ID NO: 32 oder eine aquivalente Restriktiensschnittstel- 
len enthaltende Sequenz, 

35 

L2 = unabhangig voneinander SEQ ID NO: 33, 34 oder 35 oder aqui- 
valente Restriktionsschnittstellen enthaltende Sequenzen, 

Promoter = pflanzlicher Promoter 

40 

Strukturgen = eine in Pflanzen exprimierbare 
Nukleinsauresequenz . 

Vorteilhaft ist das Strukturgen ein Biesynthesegen, boevorzugt 
45 ist es ein Biosynthesegen des Lipid- oder Fettsaurestof fwechsels , 
vorteilhaft ein pflanzliches Gen. In einer besonders vorteilhaf- 
ten Aus f-Qhrungs form ist das Strukturgen eine Nukleinsauresequenz, 
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die fur Proteine ausgewahlt aus der Gruppe : 

Acyl-CoA-Dehydrogenase (n) , Acyl-ACP[= acyl carrier protein] - 
Desaturase (n) , Acyl-ACP-Thioesterase (n) , Fettsaure-Acyl-Transf e- 
rase (n) , Fettsaure-Synthase (n) , Fettsaure-Hydroxylase (n) , Acetyl- 
5 Coenzym A-Carboxylase (n) , Acyl-Coenzym A-Oxidase (n) , Fettsaure- 
Desaturase (n) , Fettsaure-Acetylenasen, Lipoxygenase!!, Triacylgly- 
cerol-Lipasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen oder 
Fettsaure-Elongase (n) / kodiert . 

10 Ganz besonders bevorzugt ist das Strukturgen eine Nukleinsaurese- 
qiienz ausgewahlt aus der Gruppe: 

a) einer Nukleinsauresequenz mit der in SEQ ID NO : 1, SEQ ID NO: 
3, SEQ ID NO: 5 oder SEQ ID NO: 11 dargestellten Sequenz , 

15 

b) NukleinsS-uresequenzen, die aufgrund des degenerierten geneti- 
schen Codes durch. Ruckiibersetzung der in SEQ ID NO: 2, 

SEQ ID NO: 4, SEQ ID NO : 6 oder SEQ ID NO: 12 dargestellten 
Aininosauresequenzen erhalten werden, 

20 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO : 5 oder 
SEQ ID NO: 11 dargestellten Nukleinsauresequenz, die fiir Po- 
lypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6 
Oder SEQ ID NO: 12 dargestellten Aminosauresequenzen codieren 

25 und mindestens 50 % Homologie auf Aminosaureebene aufweisen, 

ohne daS die enzymatische Wirkung der Polypeptide wesentlich 
reduziert ist. 

Unter einer Squivalente Restriktionsschnittstellen enthaltende 
30 Sequenz im Sinne der Erfindung sind Sequenzen zu verstehen, die 

Restriktionsschnittstellen enthalten, die fiir den Aufbau itiultip- 

ler Expressionskassetten geeignet sind, das heiSt geeigneter 

Weise nicht im Strukturgen vorhanden sind oder im binaren Vektor . 

Solche Restriktionsschnittstellen wie beispielhaft EcoRI, BamHI, 
35 Sad/ PstI, Ncol, Ndel, Bgll, Bglll, Xhol, Xba und weitere sind 

dem Fachmann bekannt und konnen einschlagigen Fachbiichern entnom- 

men werden. 

Die erf indungsgemaSen Expressionskassetten konnen fur die Expres- 
40 sion von Genen in wirtschaf tlich wichtigen Kulturpf lanzen wie 
beispielsweise Lein, fur die keine endogenen samenspezif ischen 
Promotoren bekannt waren, verwendet werden. Lein ist, wie die 
vorliegenden Arbeiten zeigten, ftir eine samenspezif is che Expres- 
sion von Genen besonders problematisch, da of f ensichtlich mehrere 
45 Promotoren, die vom Fachmann fur samenspezif ische Expression in 
anderen Pf lanzen routinemaSig benutzt werden, in z.B. in anderen 
Pf lanzen wie Lein nicht funktionieren, das heiEt nicht zu einer 
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Transkription bzw. letztlicii zu einer Expression der mRNA des 
Strukturgens f tihrt . 

Verwendung der oben genannten erf indungsgemaSen Expressionskas- 
5 setten in einem Verfahren zur Herstellung von Fetts^ureestern mit 
einem erhohtem Gehalt an mehrfach imgesattigten Fettsauren mit 
mindestens zwei Doppelbindungen dadurch gekennzeichnet , daS man 
mindestens eine Nukleinsauresequenz ausgewahlt aus der Gruppe 



10 a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 

SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 11 dargestellten 
Sequenz , 



b) Nukleinsauresequenzen, die aufgrund des degenerierten 
15 genetischen Codes durch Ruckiibersetzung der in SEQ ID NO: 2, 

SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten 
Aminosauresequenzen erhalten werden. 



c) Derivate der in SEQ ID NO : 1, SEQ ID NO: 3, SEQ ID NO: 5 
20 Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, die 

fur Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten Aminosaure- 
sequenzen codieren und mindestens 50 % Homologie auf Amino- 
saureebene aufweisen, ohne dass die enzymatische Wirkung 
25 der Polypeptide wesentlich reduziert ist. 



in einen Fettsaureester produzierenden Organismus einbringt, 
anzieht und die dem Organismus enthaltenden Fettsaureester iso- 
liert . 

30 (.. .."J f ~ j 

Bei den im Verfahren verwendeten Nukleinsauresequenzen handelt es 
sich urn isolierte Nukleinsauresequenzen, die ftir Polypeptide mit 
A-5-, A-6- Oder A~12-Desaturaseaktivitat codieren. j ; 

35 Im Verfahren werden vorteilhaft Fettsaureester mit mehrfach unge- 
stattigten Cis-/ C2o~ und/oder C22-F^ttsauremolekulen mit 
mindestens zwei Doppelbindiongen im Fettsaureester hergestellt. 
Bevorzugt enthalten diese Fettsauremolekule drei, vier oder ftinf 
Doppelbindungen und fiihren vorteilhaft zur Synthase von Arachi- 

40 donsaure (ARA) , Eicosapentaensaure (EPA) oder Docosahexaensaure 

(DHA) . ; ; 

I 

Die Fettsaureester mit mehrfach imgesattigten Ci8~/ ^20-- und/oder 
C22-Fettsauremolektilen konnen aus den Organismen, die ftir die Her- 
45 stellung der Fettsaureester veinA^endet wurden, in Form eines Ols 
oder Lipids beispielsweise in Form von Verbindungen wie Sphingo- 
lipide, Phosphoglyceride, Lipide, Glycolipide, Phospholipide, 
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Monoacylglyceride, Diacylglyceride , Triacylglyceride oder 
sonstige Fettsaureester , die die mehrfach imgesattigten Fett- 
sauren mit mindestens zwei Doppelbindungen enthalten, isoliert 

. werden . 

5 

Als Organismus fur die Herstellung im Verfahren kommen prinzipell 
alia prokaryontischen oder eurkaryontischen Organismen wie proka- 
ryontische oder eurkaryontische Mikroorganismen wie gram-positive 
oder gram-negative Bakterien, Pilze, Hefen, Algen, Ciliaten, tie- 

10 rische oder pflanzliche Zellen, Tiere oder Pflanzen wie Moose, 
zweikeimblattrige oder einkeimblattrige Pflanzen in Frage, Vor- 
teilhaf t werden Organismen im erf ind\ingsgemai3.en Verfahren ve3rwen- 
det, die zu den 01-produzierenden Organismen gehoren, das heiE>t 
die fiir die Herstellung von Olen verwendet werden, wie Mikroorga- 

15 nismen wie Crypthecodinium, Thraustochytrium, Phaeodactylum Tind 
Mortierella, Entomophthora , Mucor, Crypthecodinium sowie andere 
Algen oder Pilze sowie Tiere oder Pflanzen, insbesondere Pflanzen 
bevorzugt Olf ruchtpf lanzen, die groi?.e Mengen an Lipidverbindungen 
enthalten, wie Sojabohne, Erdnuss, Raps, Canola, Sonnenblume, 

20 Safflor, Nachtkerze, Lein, Soja, Borretsch, Baime (Olpalme, Ko- 
kosnuss) oder Feldfriichte, wie Mais, Weizen, Roggen, Hafer, 
Triticale, Reis, Gerste, Baumwolle, Maniok, Pfeffer, Tagetes, So- 
lanaceen-Pf lanzen, wie Kartoffel, Tabak, Aubergine und Tomate, 
Vicia-Arten, Erbse, Alfalfa oder Buschpf lanzen (Kaffee, Kakao, 

25 Tee) , Salix-Arten, Baume (5lplame, KokosnulS) sowie ausdauernde 
Graser und Futterf eldf riichte . Besonders bevorzugte erf indungsge- 
maSe Pflanzen sind Olfruchtpf lanzen, wie Soja, ErdnuE., Raps, Ca- 
nola, Lein, Nachtkerze, Sonnenblume, Safflor oder Baume (Olpalme, 
KokosnuS) . 

30 

Das Verfahren beinhaltet entweder die Zuchtung eines geeigneten 
transgenen Organismus bzw. transgenen Mikroorganismus oder die 
Ziichtiing von transgenen Pf lanzenzellen, -geweben, -organen oder 
ganzen Pflanzen, umfassend die erf indungsgemaSen Nukleotidsequen-- 

35 zen der SEQ ID NO: 1, 3, 5 oder 11 gegebenenf alls in Verbindungen 
mit den in SEQ ID NO: 7 und/ oder SEQ ID NO: 9 darges tell ten Se- 
quenzen allein oder in Kombination mit Sequenzen von vorteilhaf- 
ten erf indungsgemaiSen Expressionskassetten in vorteilhaf ten Vek- 
tor en mit SEQ ID NO: 13-17 oder ihre Homologen, Derivate oder 

40 Analoga oder ein Genkonstrukt , das die SEQ ID NO: 1, 3, 5 oder 11 
ggf , in Verbindung mit SEQ ID NO: 7 und/oder 9 oder ihre Homolo- 
gen, Derivate oder Analoga umfasst, oder einen Vektor, der diese 
Sequenz oder das Genkonstrukt umfasst, welches die Expression er- 
f indungsgemaEer Nukleinsauremolektile herbeifuhrt, so dass eine 

45 Feinchemikalie produziert wird, Bei einer bevorzugten Ausfiih- 

rungsform umfasst das Verfahren ferner den Schritt des Gewinnens 
einer Zelle, die eine solche erf indungsgemaEe Nukleinsauresequen- 
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zen entiialt, wobei sine Zelle mit einer Desaturasenukleinsaurese- 
quenz, einem Genkonstrukt oder einem Vektor, welche die 
Expression einer erf indungsgemaSen Desaturasenukleins^ure allein 
Oder in Kombination herbeiftihren, trans foirmiert wird. Bei einer 
5 weiteren bevorzugten Ausfiihrungsf orm umfasst dieses Verfahren 
ferner den Schritt des Gewinnens der Feincheitiikalie aus der 
Kultur. Bei einer besonders bevorzugten Ausfiihrungsf orm gehort 
die Zelle zur Ordnung der Ciliaten, zu Mikroorganismen, wie 
Pilzen, ' oder zum Pf lanzenreich, insbesondere zu Olf ruchtpf lanzen, 
10 besonders bevorzugt sind Mikroorganismen oder Olf ruchtpf lanzen 
beispielsweise Erdnuss, Raps, Canola, Lein, Soja, Saf flower 
(Distel) , Sonnenblumen oder Borretsch. 

Unter transgen im Sinne der Erfindung ist zu verstehen, daS die 
15 im Verfahren verwendeten Nukleinsauren oder die erf indungsgemaiSen 
Expressionskassetten nicht an ihrer natiirlichen Stelle im Genom 
eines Organismus sind, dabei konnen die Nukleinsauren homolog 
Oder heterolog exprimiert werden. Transgen bedeutet aber auch, 
dass die Nukleinsauren oder Expressionskassetten an ihrem natiir- 
20 lichen Platz im Genom eines Organismus sind, dass jedoch die Se- 
quenz gegeniiber der natiirlichen Seqiienz verandert wurde und/oder 
das die Regulationssequenzen, der natiirlichen Sequenzen verandert 
wurden. Bevorzugt ist unter transgen die Expression der erf in- 
dungsgemaiSen Nukleinsauren an nicht nattirlicher Stelle im Genom 
25 zu verstehen, das heiiSt eine homologe oder bevorzugt heterologe 
Expression der Nukleinsauren liegt vor. Bevorzugte transgene Or- 
ganismen sind die oben genannten transgenen Pflanzen bevorzugt 
Olf r uch t p f 1 anz en . 

30 Aus den im Verfahren hergestellten Fettsaureestern lassen sich 

die enthaltenden mehrfach ungesattigten Fettsauren beispielsweise 
iiber eine Alkalibehandlung wie wassrige KOH oder NaOH vorteilhaft 
in Gegenwart eines Alkohols wie Methanol oder Ethanol freisetzen 
und isolieren iiber beispielsweise Phasentrennung und anschlielSen- 

35 der Ansauerung iiber z.B. H2SO4. 

Die im Verfahren hergestellten Fettsaureester fallen in Form von 
Olen, Lipiden und/oder Fettsauren an, die mindestens zwei Doppel- 
bindungen in den Fettsauremolekiilen bevorzugt drei, vier, fiinf 

40 oder sechs Doppelbindungen enthalten. Auch sind Zusammensetzun- 
gen, die die genannten 01-/ Lipid- und/oder Fettsauren enthalten, 
sowie die Verwendung der Ole, Lipide und/oder Fettsauren oder der 
Zusammensetzungen in Futter, iSTahrungsmitteln, Kosmetika oder 
Pharmazeutika ein weiterer Anwendungsmoglichkeit der vorgenannten 

45 Stoffe. 
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Ein weiterer Aspekt betrif ft ein Verfahren zur Modulation der 
Produktion eines Molekiils durch einen Mikroorganismus . Diese Ver- 
fahren "umfassen das Zusammenbringen der Zelle mit einer Substanz, 
welche die erf indungsgemaSen Desaturaseaktivitat allein oder in 
5 Kombination oder die Desaturasenukleinsaureexpression moduliert, 
so dass eine zellassoziierte Aktivitat relativ zu der gleictien 
Aktivitat in Abwesenheit der Substanz verandert wird. Bei einer 
bevorzugten Ausf iihrungsf oztu wird/werden ein oder zwei Stoffwech- 
selweg(e) der Zelle fur Lipide und Fettsauren, Cofaktoren und En- 

10 zyme moduli ert oder der Transport von Verbindungen uber diese 
Membranen inoduliert, so dass die Ausbeute oder die Rate der 
Produktion einer gewunschten Feinchemikalie durch diesen Mikro- 
organismus verbessert ist. Die Substanz, welche die Desaturase- 
aktivitat moduliert, kann eine Substanz sein, welche die 

15 Desaturaseaktivitat oder Desaturasenukleinsaureexpression 

stimuliert oder die als Zwischenprodukt bei der Fettsaurebio- 
synthese verwendet werden kann. Beispiele fur Substanzen, welche 
die Desaturaseaktivitat oder Desaturasenukleinsaureexpression 
stimulieren, sind u.a. kleine Molekule, aktive Desaturasen sowie 

20 desaturasenkodierende Nukleinsauren, die in die Zelle eingebracht 
worden sind. Beispiele fur Substanzen, welche die Desaturase- 
aktivitat Oder -Expression hemmen, sind u.a. kleine Molekule 
und Antisense- Desaturasenukleinsauremolekiile . 

25 Ein weiterer Aspekt betrif ft ein Verfahren zur Modulation der 

Ausbeuten einer gewunschten Verbindung aus einer Zelle, umfassend 
das Einbringen eines Wildtyp- oder Mutanten-Desaturasegens , das 
entweder auf einem separaten Plasmid gehalten oder in das Genom 
der Wirtszelle integriert wird, in eine Zelle. Bei Integration in 

30 das Genom kann die Integration zufallsgemaS sein oder durch der- 
artige Rekombination erfolgen, dass das native Gen durch die ein- 
gebrachte Kopie ersetzt wird, wodurch die Produktion der ge- 
wunschten Verbindung durch die Zelle moduliert wird, oder durch 
Verwendung eines Gens in trans, so dass das Gen mit einer funk- 

35 tionellen Expressionseinheit , welche mindestens eine die Expres- 
sion eines Gens gewahrleistende Sequenz und mindestens eine die 
Polyadenylierung eines funktionell transkribierten Gens gewahr- 
leistende Sequenz enthait, funktionell verbunden ist. 

40 Bei einer bevorzugten Form des Verfahrens sind die Ausbeuten 
modifiziert. Bei einer weiteren bevorzugten Aus fuhrungs form 
wird die gewiinschte Chemikalie vearmehrt, wobei unerwunschte 
storende Verbindungen vermindert werden konnen. Bei einer 
besonders bevorzugten Aus fuhrungs form ist die gewiinschte Fein- 

45 chemikalie ein Lipid oder eine Fettsaure, ein Cofaktor oder ein 
Enzym. Bei besonders bevorzugten Aus fuhrungs form ist diese 
Chemikalie eine mehrfach ungesattigte Fettsaure. Starker bevor- 
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zugt ist sie ausgewahlt aus Arachidonsaure (ARA) , Eicosapentaen- 
saure (EPA) oder Docosahexaensaure (DHA) . 

Die vorliegende Erfindung stellt vorteilliaf te Multiexpressions- 
5 kassetten und Konstrukte zur multiparallelen samenspezif ischen 
Expression von Genkoinbinationen in Pflanzen zur Verfxigung. 

Diese konnen im oben beschriebenen Verfahren zur Expression von 
Genen, bevorzugt den in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, 
10 SEQ ID NO: 1 , SEQ ID NO : 9 oder SEQ ID NO: 11 beschriebenen, in 
Algen und Pilzen und Pflanzen, insbesondere Olf ruchtpf lanzen sind 
bevorzugte Organismen fur das Verfaiiren verwendet werden, 

Durch die Verwendung der erf indungsgemaSen Expressionskassetten 

15 konnen im Verfahren in Verbindung mit den oben genannten Nuklein- 
sauremolekule zur gentechnologisch Veranderung von Pflanzen ver- 
wendet werden, so dass sie schlieSlich zur Herstellung von besse- 
ren oder ef f izienteren Produzenten einer oder mehrerer Feinchemi- 
kalien fuhren. Diese verbesserte Produktion oder Effizienz der 

20 Produktion einer Feinchemikalie kann durch eine direkte Wirkung 
der Manipulation eines erf indungsgemaSen Gens oder durch eine in- 
direkte Wirkung dieser Manipulation hervorgeruf en werden. Unter 
Feinchemikalien sind im Sinne der Erfindung beispielsweise Fett- 
saureester, die mehrfach ungesattigte Fettsauren mit mindestens 

25 zwei Doppelbindungen enthalten wie Sphingolipide, Phosphoglyce- 
ride, Lipide, Glycolipide, Phospholipide, Monoacylglyceride , Dia- 
cylglyceride, Triacylglyceride oder sonstige Fettsaureester , die 
die mehrfach ungesattigten Fettsauren mit mindestens zwei Doppel- 
bindungen enthalten, zu verstehen. Weiter sind darunter zu ver- 

30 stehen Verbindungen wie Vitamine beispielsweise Vitamin E, Vita- 
min C, Vitamin B2, Vitamin B6, Pantolacton, Carotinoide wie Asta- 
xanthin, p-Carotin, Zeaxanthin und andere. 

Moose und Algen sind die einzigen bekannten Pf lanzensysteme, 
35 die erhebliche Mengen an mehrfach ungesattigten Fettsauren, wie 
Arachidonsaure (ARA) und/oder Eicosapentaensaure (EPA) und/oder 
Docosahexaensaure (DHA) herstellen. Moose enthalten PUFAs in 
Membranlipiden wahrend Algen, algenverwandte Organismen und 
einige Pilze auch nennenswerte Mengen an PUFAs in der Triacyl- 
40 glycerolf raktion akkumulieren, Daher eignen sich Nukleinsaure- 

molekule, die aus solchen Stammen isoliert werden, die PUFAs auch 
in der Triacylglycerolf raktion akkumulieren, besonders vorteil- 
haft zur Modifikation des Lipid- und PUFA-Produktionssystems in 
einem Wirt, insbesondere in Mikroorganismen, wie den vorstehend 
45 erwahnten Mikroorganismen, und Pflanzen, wie Olf ruchtpf lanzen, 
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beispielsweise Raps, Canola, Lein, Soja, Sonnenbliomen, Borretsch. 
Sie sind deshalb vorteilhaft im Verfahren verwendbar. 

Die im Verfahren unter Verwendiing der erf indungsgemaSen Expres- 
5 sionskassetten verwendeten NukleinsSuresequenzen codieren ftir 
Desaturasen, die zur Produktion langkettiger mehrfach unge- 
sattigter Fettsauren, vorzugsweise mit mehr als seclizehn, 
achtzehn oder zwanzig Kohlenstof fat omen im Kohlenstof f grundgeriist 
der Fettsaure und/oder mindestens zwei Doppelbindungen in der 

10 Kohlenstof fkette, geeignet sind, wobei eine Nukleinsaure fur ein 
Enzym codiert, das Doppelbindungen in die A-5-Position, in einem 
anderen Fall in die A-6-Position und in einem weiteren Fall in 
die A-12 -Position einfiihren kann. Mithilfe dieser Nukleinsauren 
konnen hohe Mengen an PUFAs in der Triacylgycerolf raktion erhal- 

15 ten werden. Weiterhin wurden weitere Desaturasen isoliert, die 
allein oder zusammen mit einer A-4-Desaturase fur ein Verfahren 
zur Produktion polyungesattigter Fettsauren genutzt werden kon- 
nen. Dabei ist in der Anmeldung unter ^dem Singular d.h. unter ei- 
nem Desaturasegen oder -Protein auch der Plural d.h. die Desatu- 

20 rasegenen oder -Proteinen zu verstehen. 

Die Herstellung einer Triensaure mit Cis-Kohlenstof f kette mit- 
hilfe von Desaturasen konnte bisher gezeigt werden. In diesen 
literaturbekannten Verfahren wurde die Herstellung von y-Linolen- 
25 saure beansprucht. Bisher konnte jedoch niemand die Herstellung 
sehr langkettiger mehrfach ungesattigter Fettsauren (mit C20- und 
langerer Kohlenstof fkette sowie von Triensauren und hoher unge- 
sattigten Typen) allein durch modifizierte Organismen zeigen. 

30 Zur Herstellung der erf indungsgemMSen langkettiger PUFAs miissen 
die mehrfach ungesattigten Ci8~Fettsauren zunachst durch die 
enzymatische Aktivitat einer Elongase um mindestens zwei Kohlen- 
stof fatome verlangert werden. Nach einer Elongationsrunde fiihrt 
diese Enzymaktivitat zu Cao-F^ttsauren, und nach zwei, drei und 

35 vier Elongationsrunden zu C22~^ oder C26~Fettsauren . Die in 

dieser Erfindung offenbarten Nukleinsaureseq^ienzen, die ftir ver- 
schiedene Desaturasen codieren, 'koxmen im Konzert mit Elongasen 
zu sehr langkettigen, polyungesattigten fuhren. Die Aktivitat 
der erf indungsgemaiSen Desaturasen ftihrt vorzugsweise zu Cis-/ Cao"* 

40 und/oder C22""^^^ttsauren mit mindestens zwei Doppelbindungen im 
Fettsauremolekul, vorzugsweise mit drei, vier, fiinf oder sechs 
Doppelbindungen, besonders bevorzugt zu Ci8~ und/oder C2o-"Fett- 
sauren mit mindestens zwei Doppelbindungen im Fettsauremolekul, 
vorzugsweise mit drei, vier oder fiinf Doppelbindungen im Molekul. 

45 Die Fettsaureelongation kann durch Kombination der erf indungsge- 
maE.en Desaturasen mit einer Elongaseaktivitat erfolgen, wobei die 
durch die in SEQ ID NO: 9 codierte Elongase vorteilhaft verwendet 
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warden kaim. Nachdem die Verlangerung mit dem erf indungsgemaSen 
EnzYm(en) stattgef unden hat, konnen weitere Desaturierungs- 
scliritte wie z.B. eine solche in A--5-Position erfolgen. Auch die 
Kombination mit anderen Elongasen wie solche, die zu einer Ver^ 
5 langerimg von Cis- auf C20- oder von C20- siuf C22-24 Ketten wie in 
WO0012720 of f enbart fiihrt, kann Verwendung finden und/oder einer 
Desaturase mit Aktivitat fur A-4-Position kann vorteilhaft ein- 
gesetzt werden, urn die hoch desaturierten Fettsauren zu erhalten. 
Daher ftihren die Produkte der Desaturaseaktivitaten und der 

10 moglichen weiteren Desaturierung zu bevorzugten PUFAs mit einem 
hoheren Desaturierungsgrad, wie Dihomo-gamma-Lonolensaure , 
Docosadiensaure , Arachidonsaure , CoS-Eicosatriendihomo-Y-linolen- 
saure , Eicosapentaensaure / C03 -Eicosatriensaure , 0)3 -Eicosatetraen- 
saure, DocosapentaensMure oder Docosahexaensaure • Substrate der 

15 erf indungsgemaSen Enzymaktivitat sind zum Beispiel Taxolsaure; 

6, 9-Octadecadiensaure, Linolsaure, Pinolensaure, a-oder y-Linolen- 
saure oder Stearidonsaure sowie Arachidonsaure, Eicosatetraen- 
saure, Docosapentaensaure , Eicosapentaensaure. Bevorzugte Sub- 
strate sind Linolsaure, y-Linolensaure und/oder a-Linolens^ure 

20 sowie Arachidonsaure, Eicosatetraensaure, Docosapentaensaure, 
Eicosapentaensaure, Besonders bevorzugt als Produkte des 
erf indungsgemaSen Verfahrens sind Arachidonsaure, Docosapentaen- 
saure, Eicosapentaensaure, Die Cis-Fetts^uren mit mindestens zwei 
Doppelbindungen in der Fettsaure konnen durch die erfindungs- 

25 gema£e enzymatische Aktivitat in Form der freien Fettsaure oder 
in Form der Ester, wie Phospholipide, Glycolipide, Sphingolipide, 
Phosphoglyceride, Monoacylglyceride , Diacylglyceride oder Tri- 
acylglyceride, ver linger t werden. 

30 Fiir die menschliche Ernahrung ist konjugierte Linolsaure '"CLA" 
von besonderer Bedeutung. Unter CLA versteht man insbesondere 
Fettsauren wie C18:2 9 utrans oder das Isomer C18:2 lotrans, 12 cis^ 
die aufgrund menschlicher Enzymsysteme nach Aufnahme im K5rper 
desaturiert bzw. elongiert werden konnen und zu gesundheits- 

35 fordernden Effekten beitragen konnen. Mit den erf indungsgemaSen 
Desaturasen (A-12 -Desaturase) konnen auch solche konjugierten 
Fettsauren mit wenigstens zwei Doppelbindungen im Molekiil 
desaturiert werden und damit solche gesimdheitsf ordernden 
Fettsauren der menschlichen Ernahrung zugefuhrt werden. Weitere 

40 Beispiel fiir konjugierte Fettsauren sind alpha-Parinarsaure, 
Punicasaure, Eleostearinsaure und Calendulasaure . 

Unter der Verwendung von der erf indungsgemaSen Expressionkasset- 
ten in Klonierungsvektoren in Pflanzen und bei der Pf lanzentrans- 
45 formation, wie denjenigen, die verof f entlicht sind in und dort 
zitiert sind: Plant Molecular Biology and Biotechnology (CRC 
Press, Boca Raton, Florida), Kapitel 6/7, S. 71-119 (1993); F.F. 
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White, Vectors for Gene Transfer in Higher Plants; in; Transgenic 
Plants, Bd. 1, Engineering and Utilization, Hrsgb. : Kung und R. 
Wu, Academic Press, 1993, 15-38; B. Jenes et al . , Techniques for 
Gene Transfer, in: Transgenic Plants, Bd, 1, Engineering and Uti- 
5 lization, Hrsgb.: Kung und R. Wu, Academic Press (1993), 128-143; 
Potrykus, Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991), 
205-225) ) , lassen sich Gene vorteilhaft Biosynthesegene wie 
die oben beschriebenen Nukleinsauren zur gentechnologischen Ver- 
anderung eines breiten Spektrums an Pflanzen verwenden, so dass 

10 diese ein besserer oder ef f izienterer Produzent beispielsweise 
eines oder mehrerer von Lipiden hergeleiteter Produkte, wie PU- 
FAs, werdeu. Diese verbesserte Produktion oder Effizienz der Pro- 
duktion eines beispielsweise von Lipiden hergeleiteten Produktes, 
wie FUFAs , kann durch direkte ^^irkung der Manipulation oder eine 

15 indirekte Wirkung dieser Manipulation hervorgeruf en werden. 

Es gibt eine Reihe von Mechanismen, durch die die Veranderung 
eines erf indungsgema£en Desaturaseproteins die Ausbeute, 
Produktion und/ oder Effizienz der Produktion einer Fein- 

20 chemikalie aus einer Olfruchtpf lanze oder einem Hikroorganismus 
aufgrxind eines veranderten Proteins direkt beeinflussen kann. 
Die Anzahl oder Aktivitat des Desaturaseproteins oder -Gens 
sowie von Genkoinbinationen von Desaturasen und Elongasen kann 
erhoht sein, so dass grdiSere Mengen dieser Verbindungen de 

25 novo hergestellt werden, well den Organismen diese AktivitMt 
und F^igkeit zur Biosya these vor dem Einbringen des ent- 
sprechenden Gens fehlte. Entsprechendes gilt fur die Koxobination 
mit weiteren Desaturasen oder Elongasen oder weiteren Enzymen 
aus dem Lipids toff wechsel . Auch die Verwendung verschiedener 

30 divergenter, d.h. auf DNA-Sequenzebene unterschiedlicher 
Sequenzen kann dabei vorteilhaft sein bzw. die Verwendung 
von Promotoren zur Genexpression, die eine andere zeitliche 
Genexpression z.B, abhangig vom Reifegrad eines Samens oder 
01-speichernden Gewebes erm5glicht. 

35 

Durch das Einbringen eines Desaturasegens oder mehrerer Desatura- 
segene unter Kontrolle der erf indungsgemaSen Expressionskassetten 
in einen Organismus allein oder in Kombination mit anderen Genen 
in eine Zelle kaim nicht nur den Biosynthesef luss zum Endprodukt 

40 erhoht, sondern auch die entsprechende Zusammensetzung der Enpro-- 
dukte beispielsweise der Triacylglycerine erhoht oder de novo ge- 
schaffen werden, Ebenso kann die Anzahl oder Aktivitat anderer 
Gene, die am Import von Nahrstoffen, die zur Biosynthese einer 
Oder mehrerer Feinchemikalien (2,B. Fettsauren, polaren und neu- 

45 tralen Lipiden) notig sind, erhdht sein, so dass die Konzentra- 
tion dieser Vorlaufer, Cofaktoren oder Zwischenverbindungen in- 
nerhalb der Zellen oder innerhalb des Speicherkompartiments er- 
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h5ht ist, wodurch die F^higkeit der Zellen zur Produktion von PU- 
FAs, wie im folgenden beschrieben, weiter gesteigert wird. Fett- 
sauren und Lipide sind selbst als Feinchemikalien wunschenswert ; 
durch Optimierung der Aktivitat oder Erhohung der Anzahl einer 
5 Oder mehrerer Desaturasen, die an der Biosyn these dieser Verbin- 
dungen beteiligt sind, oder durch Zerstoren der Aktivitat einer 
Oder mehrerer Desaturasen, die am Abbau dieser Verbindungen be- 
teiligt sind, kann es moglich sein, die Ausbeute, Produktion imd/ 
Oder Effizienz der Produktion von Fettsaure- und Lipidtnolekulen 
10 aus Pflanzen oder Mikroorganismen zu steigern. 

Die Mutagenese der/des erf indungsgemaSen Desaturasegene ( s ) kann 
weiterhin zu einem Desaturaseprotein mit geanderten Aktivitaten 
fiihren, welche die Produktion einer oder mehrerer gewiinschter 

15 Feinchemikalien direkt oder indirekt beeinf lussen . Beispiels- 
weise kann die Anzahl oder Aktivitat der/des erf indungsgemaSen 
Desaturasegens (e) gesteigert werden, so dass die normalen Stoff- 
wechselabf alle oder -nebenprodukte der Zelle (deren Menge mog- 
licherweise aufgrund der Uberproduktion der gewiinschten Fein- 

20 chemikalie erhoht ist) effizient exportiert werden, bevor sie 
andere Molekule oder Prozesse innerhalb der Zelle (welche die 
Lebensf ahigkeit der Zelle senken wiirden) zerstoren oder die Bio- 
synthesewege der Feinchemikalie storen wiirden (wodurch die Aus- 
beute, Produktion oder Effizienz der Produktion der gewiinschten 

25 Feinchemikalie verringert wird) . Ferner konnen die relativ groSen 
intrazellularen Mengen der gewiinschten Feinchemikalie selbst 
toxisch fiir die Zelle sein oder Enzym-Riickkopplungsmechanismen, 
wie die allosterische Regulation, storen, beispielsweise konnte 
sie durch Steigerung der Aktivitat oder Anzahl anderer strom- 

30 abwarts folgender Enzyme oder Entgif tungsenzyme des PUFA-Wegs 

die Allokation der PUFA in die Triacylgylcerin-Fraktion steigern, 
man konnte die Lebensf ahigkeit von Saatzellen erhohen, was 
wiederum zu besserer Entwicklung von Zellen in Kultur oder zu 
Saaten fiihrt, die die gewiinschte Feinchemikalie produzieren. 

35 Das erf indungsgemaiSe Desaturasegen kann auch so manipuliert 

werden, dass die entsprechenden Mengen der verschiedenen Lipid- 
und Fettsauremolekule hergestellt werden. Dies kann eine ein- 
schneidende Wirkung auf die Lipidzusammensetzung der Membran 
der Zelle haben und erzeugt neue Ole zusatzlich zum Auftreten 

40 neusynthetisierter PUFAs. Da jeder Lipidtyp unterschiedliche 
physikalische Eigenschaf ten hat, kann eine Veranderung der 
Lipidzusammensetzung einer Membran die Membranf luiditat erheb- 
lich verandern. Anderungen der Membranf luiditat konnen sich 
auf den Transport von Molektilen liber die Membran sowie auf die 

45 Unversehrtheit der Zelle auswirken, die beide eine entscheidende 
Wirkung auf die Produktion von Feinchemikalien besitzen. In 
Pflanzen konnen diese Anderungen tiberdies auch andere Merk- 
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male, wie Toleranz gegenilber abiotischen xind biotischen Stress- 
s i tua t ionen , beeinf lus s en . 

Im Verfahren konnen isolierte Nukleinsauremolekiile (z.B. cDNAs) , 
5 imfassend Nukleotidsequenzen, die eine Desaturase oder mehrere 
Desaturasen oder biologisch aktive Telle davon codieren, oder Nu- 
kleinsaurefragmente, die sich als Primer oder Hybridisierungsson- 
den zum Nachweis oder zur Amplif ikation desaturasekodierender 
Nukleinsauren (z.B, DNA oder mRNA) eignen, verwendet werden. Bel 

10 besonders bevorzugten Ausfiihrungsf ormen umfasst das Nukleinsaure- 
molektil eine der in Sequenz ID N0:1 bzw 3 und 5 dargestellten Nu- 
kleotidseqxienzen oder die kodierende Region oder ein Komplement 
einer dieser Nukleotidsequenzen. Bel anderen besonders bevorzug- 
ten Ausftilirungsf ormen umfasst das isolierte Nukleinsauremolekiil 

15 eine Nukleotidsequenz , die an eine Nukleotidsequenz , wie in der 
Sequenz SEQ ID NO: 1, 3, 5 oder 11 dargestellt, oder einen Tell 
davon hybridisiert oder zu mindestens etwa 50 %, vorzugsweise 
mindestens etwa 60 %, starker bevorzugt mindestens etwa 70 %, 
80 % Oder 90 % und noch starker bevorzugt mindestens etwa 95 %, 

20 96 97 %, 98 %, 99 % oder mehr homolog dazu ist. Bel anderen 
bevorzugten Ausfuhrungsf oarmen kodiert das isolierte Nukleinsaure- 
molekiil eine der in der Sequenz SEQ ID NO: 2, 4, 6 oder 12 darge- 
stellten Aminosauresequenzen. Das bevorzugte Desaturasegen be- 
sitzt vorzugsweise auch mindestens eine der hier beschriebenen 

25 Desaturaseaktivitaten . 

Bei einer weiteren Ausfiihrungsf orm kodiert das isolierte 
Nukleinsauremolekiil ein Protein oder einen Teil davon, wobei 
das Protein oder der Teil davon eine Aminosauresequenz enthalt, 

30 die ausreicbend homolog zu einer Aminosauresequenz der Sequenz 
SEQ ID NO: 2, 4, 6 oder 12 ist, dass das Protein oder der Teil 
davon eine Desaturaseaktivitat beibehalt. Vorzugsweise behalt das 
Protein oder der Teil davon, das /der von dem Nukleinsauremolekiil 
kodiert wird, die Fahigkeit, am Stoffwechsel von zum Aufbau 

35 von Zellmembranen von Pflanzen notwendigen Verbindungen oder 
am Transport von Molekiilen iiber diese Membranen teilzunehmen. 
Bei einer Ausfiihrungsf orm ist das von dem Nukleinsauremolekiil 
kodierte Protein zu mindestens etwa 50 %, vorzugsweise mindestens 
etwa 60 % und starker bevorzugt mindestens etwa 70 %, 80 % oder 

40 90 % und am starksten bevorzugt mindestens etwa 95 %, 96 %, 97 %, 
98 %, 99 % oder mehr homolog zu einer Aminosauresequenz der 
Sequenz SEQ ID NO: 2, 4, 6 oder 12. Bei einer weiteren bevor- 
zugten Ausfiihrungsf orm ist das Protein ein Volllangen-Protein, 
das im wesentlichen in Teilen homolog zu einer gesamten Amino- 

45 sauresequenz der SEQ ID NO: 2, 4, 6 oder 12 (die von dem in 
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SEQ ID NO: 1, 3, 5 oder 11 gezeigten offenen Leserahmen herruhrt) 
ist . 

Bei anderen Ausfiihrungsf ontien umfasst die isolierte Desaturase 
5 eine Aminosauresequenz , die zu mindestens etwa 50 % homolog zu 
einer der Aminosauresequenzen der SEQ ID NO; 2, 4, 6 oder 12 ist 
und am Stof fwechsel von zum Aufbau von Fettsauren in einem Mikro- 
organismus oder einer Pflanzenzelle notwendigen Verbindungen oder 
am Transport von Molekulen uber diese Membranen teilnehmen kann, 
10 wobei desaturierte Cis- oder C20-22-Kohlenstof fketten mit Doppel- 
bindungen an mindestens zwei Stellen gemeint ist. 

Bei einer anderen bevorzugten Ausf uhrungsf orm riihrt das isolierte 
Nukleinsauremolekul von Phaeodactyltim tricornutiira UTEX646 her 
.15 und kodiert ein Protein (z.B. ein Desaturasefusionsprotein) , 

das eine biologisch aktive Domane enth^lt, die zu mindestens etwa 
5 0 % oder mehr homolog zu einer Aminosauresequenz der Sequenz 
SEQ ID NR 2, 4, 6 oder 12 ist und die Fahigkeit, am Stof fwechsel 
von z\m Aufbau von Zellmembranen von Pflanzen notwendigen Ver- 

20 bindungen oder am Transport von Molekulen iiber diese Membranen 
teilzunehmen, beibehalt oder zumindest eine der Desaturierungs- 
aktivitaten resultierend in PUFAs wie GLA, ALA, Dihomo-gamma 
Linolensaure, ARA, EPA oder DHA oder deren Vorlauf ermolekule 
besitzt, und umfasst auch heterologe Nukleinsauresequenzen, die 

25 ein heterologes Polypeptid oder regulatorische Proteine kodieren. 

Alternativ kann die isolierte Desaturase eine Aminosauresequenz 
umfassen, die von einer Nukleotidsequenz kodiert wird, die an 
eine Nukleotidsequenz der SEQ ID NO: 1, 3, 5 oder 11 hybridi- 

30 siert, z.B. unter stringenten Bedingungen hybridisiert , oder zu 
mindestens etwa 50 %, vorzugsweise mindestens etwa 60 %, starker 
bevorzugt mindestens etwa 70 %, 80 % oder 90 % und noch starker 
bevorzugt mindestens etwa 95 %, 96 %, 97 %, 98 %, 99 % oder mehr 
homolog dazu ist. Es ist ebenfalls bevorzugt, dass die bevor- 

35 zugten Desaturasef ormen ebenfalls eine der hier beschriebenen 
Desaturaseaktivitaten besitzen. 

Bei einer anderen Ausfiihrungsform ist das isolierte Nukleinsaure- 
molekul mindestens 15, 25, 50, 100, 250 oder mehr Nukleotide lang 

40 und hybridisiert unter stringenten Bedingungen an ein Nuklein- 
sauremolekul, das eine Nukleotidsequenz der SEQ ID NO: 1, 3, 5 
oder 17 umfasst, Vorzugsweise entspricht das isolierte Nuklein- 
sauremolekul einem natiirlich vorkommenden Nukleinsauremolekul . 
Starker bevorzugt kodiert das isolierte Nukleinsauremolekul 

45 natiirlich vorkommende Phaeodactylum-Desaturase oder einen 
biologisch aktiven Teil davon. 
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Eine weitere Ausfuhrimgsf onti der Erfindung sind Expressions- 
kassetten, die die Expression der erf indungsgemaiSen Nukleinsauren 
mit den Sequenzen SEQ ID NO: 1, 3, 5 oder 11 in den verschiedenen 
Organismen wie pflanzliche Zellen, Geweben, Teilen von Pflanzen 
5 Oder ganzen Pflanzen ermoglichen. 

Unter der erf indungsgemaSen Expressionskassette (= Nukleinsaure- 
konstrukt oder -fragment) sind die in SEQ ID NO: 3 2 als LI und 
einem Promoter, einem Strukturgen ausgewah.lt aus den vorteilhaf- 

10 ten Sequenzen SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder 

SEQ ID NO: 11, die sich als Ergebnis des genetischen Codes und/ 
oder deren f unktionellen oder nicht funktionellen Derivate zu 
verstehen, und die Polylinder-Terminator-Polylinker-Sequenzen ( = 
L2) SEQ ID NO: 33, SEQ ID NO: 34 oder SEQ ID NO: 35 zu verstehen. 

15 Diese steuern vorteilhaf teorweise die Genexpression in der Wirts- 
zelle, Diese in den Konstrukten enthaltenen regulatoriscben Se- 
quenzen sollen die gezielte Expression der Gene und der Protei- 
nexpression ermoglichen. Dies kann beispielsweise je nach Wirts- 
organismus bedeuten, dass das Gen erst nach Induktion exprimiert 

20 imd/oder tiberexprimiert wird, oder dass es sofort exprimiert und/ 
Oder uberexprimiert wird. Beispielsweise handelt es sich bei die- 
sen regulatorischen Sequenzen um Sequenzen an die Induktoren oder 
Repressoren binden und so die Expression der Nukleinsaure regu- 
lieren. Zusatzlich zu diesen neuen Regulationssequenzen oder an- 

25 stelle dieser Sequenzen kann die nattirliche Regulation dieser Se- 
quenzen vor den eigentlichen Strukturgenen noch vorhanden sein 
und gegebenenf alls genetisch verandert worden sein, so dass die 
naturliche Regulation ausgeschaltet und die Expression der Gene 
erhdht wurde. Das Genkonstrukt kann aber auch einfacher aufgebaut 

30 sein, das heiSt es wurden keine zus^tzlichen Regulationssignale 
vor die Nukleinsauresequenz oder dessen Derivate inseriert und 
der naturliche Promoter mit seiner Regulation wurde nicht ent~ 
fernt. Stattdessen wurde die naturliche Regulationssequenz so mu- 
tiert, dass keine Regulation mehr erfolgt und/oder die Genexpres- 

35 sion gesteigert wird. Diese veranderten Promotoren konnen in Form 
von Teilsequenzen Promotor mit Teilen der erf indungsgemaJSen 
Nukleinsaure sequenzen) auch allein vor das naturliche Gen zur 
Steigerung der Aktivitat gebracht werden. Das Genkonstrukt kann 
au&erdem vorteilhaf terweise auch eine oder mehrere sogenannte 

40 ''enhancer Sequenzen" funktionell verkniipft mit dem Promotor ent- 
halten, die eine erhohte Expression der Nukleinsauresequenz er- 
moglichen. Auch am 3'-Ende der DNA-Sequenzen konnen zusatzliche 
vorteilhafte Sequenzen inseriert werden wie weitere regulatori- 
sche Elemente oder Terminatoren . Die A-5-Desaturase-/A-6-Desatu- 

45 rase und/oder A-12-Desaturasegene konnen in einer oder mehreren 
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Kopien in der Expressionskassette (= Genkonstrukt ) enthalten 
sein. 

Die regulatorischen Sequenzen bzw. Faktoren konnen dabei wie 
5 oben beschrieben vorzugsweise die Genexpression der eingefuhrten 
Gene positiv beeinflussen und dadurch erhohen. So kann eine Ver- 
starkung der regulatorischen Elemente vorteilhaf terweise auf der 
Transkriptionsebene erfolgen, indem starke Transkriptionssignale 
wie Promotoren und/oder "Enhancer" verwendet werden. Daneben ist 
10 aber auch eine Verstarkung der Translation moglich, indem bei- 
spielsweise die Stabilitat der roRNA verbessert wird. 

Bin weiterer Aspekt der Erfindung betrifft Vektoren, z.B. 
rekombinante Expressionsvektoren, die mindestens eine der erfin- 

15 dungsgemaiSen Expressionskassetten enthalten, und Wirtszellen, in 
die die erf indungsgemaSen Expressionskassetten oder diese Vekto- 
ren eingebracht worden sind, insbesondere Mikroorganismen, Pflan- 
zenzellen, Pf lanzengewebe, -organe oder ganze Pflanzen, Bei einer 
Ausftihrungsf 02nn kann eine solche Wirtszelle Feinchemikalien-Ver- 

20 bindungen, insbesondere PUFAs, speichern; zur Isolation der ge- 
wiinschten Verbindung werden die Zellen geerntet. Die Verbindung 
(Ole, Lipide, Triacylglyceride, Fettsauren) oder die Desaturase 
kSnnen dann aus dem Medium oder der Wirtszelle, welche bei Pflan- 
zen Zellen sind, die Feinchemikalien enthalten oder speichern, am 

25 starksten bevorzugt Zellen von Speichergeweben, wie Samenhtillen, 
Knollen, Epidermis- und Samenzellen, Endosperm oder Embyrogewebe 
isoliert werden . 

Noch ein weiterer Aspekt der Erfindung betrifft eine genetisch 
30 veranderte transgene Pflanze, bevorzugt ein Olfruchtpf lanze, wie 
vorstehend erwahnt, besonders bevorzugt eine Raps- oder Lein- 
pflanze, in die eine erf indungsgemaSe Expressionskassette, die 
vorteilhaf t weitere Gene wie Desaturasegen enthalt, eingebracht 
worden ist. Bei einer Aus fuhrungs form ist das Genom von Raps oder 
35 Lein durch Einbringen einer erf indungsgemaSen Expressionskassette 
vorteilhaf t enthaltend weitere Nukleinsauremolekule, die beis- 
pielsweise eine Wildtyp- oder mutierte Desaturasesequenz kodiert, 
als Transgen ver^ndert worden. Bei einer bevorzugten Ausfiihrungs- 
foicia wird Raps oder Lein auch zur Produktion einer gewiinschten 
40 Verbindung, wie Lipiden und Fettsauren, wobei PUFAs besonders be- 
vorzugt sind, verwendet. 

Bei noch einer weiteren bevorzugten Ausfuhrungsf orm kann das 
Moos Physcomitrella patens zur Demonstration der Funktion eriner 
45 Expressionskassette mit einem Desaturasesegen \mter Verwendung 
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homologer Rekoinbination auf der Basis der in dieser Erfindung be~ 
, schriebenen Nukleinsauren verwendet warden • 

Das Desaturasepolypeptid oder ein biologisch aktiver Tell davon 
5 kann vorteilhaft unter Kontrolle der erf indungsgemaEen Expres- 
sionskassette f ijnktionsf ahig mit eineiti weiteren Polypeptid, das 
eine andere enzymatische Aktivitat als die Desaturasen hat bei- 
spielsweise eine Elongase-, Acyltransf erase- oder sonstige Akti- 
vitat verbimden werden, so dass ein Fusionsprotein gebildet wird. 

10 Vorteilhaft hat dieses Fusionsprotein eine Aktivitat, die 

sich von derjenigen der Desaturase allein unterscheidet . Bei 
anderen bevorzugten Ausf lihrungsf orm nimmt dieses Fusionsprotein 
am Stoffwechsel von Verbindungen, die zur Synthese von Lipiden 
und Fettsauren, Cofaktoren und Enzymen in Mikroorganismen oder 

15 Pflanzen notwendig sind, oder am Transport von Molekiilen liber 
diese Membranen teil . Besonders vorteilhaft moduliert das Ein- 
bringen dieses Fusionsproteins in einer Wirtszelle die Produktion 
einer gewiinschten Verbindung innerhalb einer und durch die Zelle. 
Bei einer bevorzugten Ausf lihrungsf orm enthalten diese Fusion- 

20 sproteine auch A-5- oder A-15, A~17 oder 

A-19-Desaturaseaktivitaten allein oder in Kombination. Ins- 
besondere solche Genkombinationen sind bevorzugte Ausfiihrungs- 
formen, die aus SEQ ID NO: 7 oder 9 gewahlt sind, bzw Teilen 
davon, Derivate oder ihren Homologen. Insbesondere solche 

25 Kombinationen sind bevorzugt, die die vollstandige Protein- 
aktivitat wie in SEQ ID NO: 1, 3, 5 oder 11 enthalten und in 
Multiexpressionskassetten definiert durch SEQ ID NO: 13, 14, 
15, 16 und 17 eingefiigt zur Transformation von Pflanzen und I 
Expression in Pflanzen geeignet sind. 

30 

Eingehende Beschreibung der Erfindung 

Ein erf indimgsgemaSer Gegenstand sind auch die Expressionskasset- 
ten in Verbindung mit isolierten Nukleinsauresequenz ( en) , die fiir 
35 ein Polypeptid mit Desaturaseaktivitat codiert, ausgewahlt aus 
der Gruppe: 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 
SEQ ID NO: 3, SEQ ID NO: 5 oder SEQ ID NO: 11 dar- 
40 gestellten Sequenz, 

Nukleinsauresequenzen, die aufgrund des degenerierten 
genetischen Codes durch Riickubersetzung der in SEQ ID NO: 2, 
SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten 
Aminosauresequenzen erhalten werden. 



b) 

45 
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c) Derivate der in SEQ ID- NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz , 
die fiir Polypeptide luit der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten Amino saurese- 
5 quenzen codieren iind mindestens 50 % Homologie auf Amino- 

saureebene aufweisen, ohne daS die enzymatische Wirkung der 
Polypeptide wesentlich reduziert ist . 

Weiterhin betrifft die Erfindung eine Amino s aure s equenz , die 
10 durch die oben genannte(n) Nukleinsauresequenz (en) codiert werden 
(fiir die Erfindung soli der Singular den Plural und umgekehrt 
Tomfassen) . Speziell betrifft die Erfindung Aminosauresequenzen, 
die durch die in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 oder 
SEQ ID NO: 11 dargestellte Sequenz codiert werden'. 

15 

Die vorliegende Erfindxmg stellt Expressionskassetten bereit, die 
ftir die Expression von Nukleinsauren und Proteinmolekule mit De- 
saturaseaktivitat geeignet sind, und von Nukleinsauren kodierend 
fur Proteine, die am Stoffwechsel von Lipiden und Fettsauren, 

20 PUFA-Cof aktoren und Enzymen in dem Moos Physcomitrella patens 
Oder am Transport lipophiler Verbindungen liber Membranen betei- 
ligt sind. Die erf indungsgemaiSen Verbindungen lassen sich zur Mo- 
dulation der Produktion von Feinchemikalien aus Organismen wie 
Pflanzen, wie Mais, Weizen, Roggen, Hafer, Triticale, Reis, Ger- 

25 ste, Sojaboline, Erdnuss, Ba-umwolle, Linxm Arten wie 01- oder Fa- 
serlein, Brassica-Arten, wie Raps, Canola und Riibsen, Pfeffer, 
Sonnenblume, Borretsch, Nachtkerze und Tagetes, Solanacaen-Pf lan- 
zen, wie Kartoffel, Tabak, Aubergine und Tomate, Vicia-Arten, 
Erbse, Maniok, Alfalfa, Buschpf lanzen (Kaffee, Kakao, Tee) , Sa- 

30 lix-Arten, Baume (Olpalme, Kokosnuss) und ausdauernden GrSsern 
und Futterf eldf riichten, entweder direkt (z.B. wenn die Uberex- 
pression oder Optimierung eines Fettsaurebiosynthese-Proteins ei- 
nen direkten Einfluss auf die Ausbeute, Produktion und/oder Effi- 
zienz der Produktion der Fettsaure aus modif izierten Organismen 

35 hat) verwenden oder konnen eine indirekt Auswirkung haben, die 

dennoch zu einer Steigerung der Ausbeute, Produktion und/oder Ef- 
fizienz der Produktion einer gewiinschten Verbindung oder einer 
Abnahme uneirwiinschter Verbindungen fuhrt (z.B. wenn die Modula- 
tion des Stof fwechsels von Lipiden xind Fetts§.uren, Cof aktoren und 

40 Enzymen zu Veranderungen der Ausbeute, Produktion und/oder Effi- 
zienz der Produktion oder der Zusammensetzung der gewunschten 
Verbindungen innerhalb der Zellen fiihrt, was wiederum die Produk- 
tion einer oder mehrerer Feinchemikalien beeinf lussen kann) . As- 
pekte der Erfindung sind nachstehend welter erlautert. 

45 

I. Feinchemikalien und PUFAs 
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Der Begriff "Feinchemikalie" ist im Fachgebiet bekannt und 
lamfasst Molektile, die durch einen Organismus produziert worden 
sind und Anwendungen in verschiedenen Industrien finden, wie, 
aber nicht beschrankt auf, die pharmazeutische, Landwirtschaf ts-, 
5 Nahrungsmittel- und Kosmetik-Industrie . Diese Verbindungen um- 
fassen Lipide, Fettsauren, Cofaktoren und Enzyme usw. (wie z.B. 
beschrieben in Kuninaka, A. (1996) Nucleotides and related com- 
pounds, S- 561-612, in Biotechnology Bd. 5, Rehm et al . , Hrsgb., . 
VCH: Weinheim und darin enthaltenen Literaturstellen) , Lipide, 

10 gesattigte und ungesattigte Fettsauren (z.B. Arachidonsaure) , 
Vitamine und Cofaktoren (wie beschrieben in Ullmann's Ency- 
clopedia of Industrial Chemistry, Bd. A27, Vitamins, S. 443-613 
(1996) VCH: Weinheim und darin enthaltenen Literaturstellen; 
und Ong, A.S., Niki, E., & Packer, L. (1995) Nutrition, Lipids, 

15 Health and Disease Proceedings of the UNESCO/ Confederation of 
Scientific and Technological Associations in Malaysia and the 
Society for Free Radical Research - Asien, abgehalten am 1.-3. 
Sept. 1994 in Penang, Malysia, AOCS Press (1995)), Enzyme und 
samtliche anderen von Gutcho (1983) in Chemicals by Fermentation, 

20 Noyes Data Corporation, ISBN: 0818805086, und darin angegebenen 
Literaturstellen beschriebenen Chemikalien. Der Stoffwechsel und 
die Verwendungen bestimmter Feinchemikalien sind nachstehend 
weiter erlautert . 

25 Die Kombination verschiedener Vorlauf ermolekiile und Biosynthese- 
enzyme fiihrt zur Herstellung verschiedener Fettsauremolekule, was 

eine entscheidende Auswirkung auf die Zusammensetzung der Membran 
hat. Es kann angenoiranen warden, dass PUFAs nicht nur einfach in 
Triacylglycerin, sondern auch in Membranlipide eingebaut werden. 

30 

VorlMufer fiir die PUFA-Biosyn these sind beispielsweise Olsaure, 
Linol- und Linolensaure . Diese Cis-Kohlenstoff -Fettsauren 
mussen auf C20 ™Ld C22 verlangert werden, damit Fettsauren 
vom Eicosa- und Docosa-Kettentyp erhalten werden. Mithilfe 

35 verschiedener Desaturasen, wie Enzymen, welche A-12-Desaturase, 
A-15-Desaturase, A-6-Desaturase-, A-5" und A-4-Desaturase- 
aktivitat aufweisen, konnen Arachidonsaure, Eicosapentaensaure 
und Docosahexaensaure sowie verschiedene andere langkettige PUFAs 
erhalten, extrahiert und fiir verschiedene Zwecke bei Nahrungs- 

40 mittel-, Futter-, Kosmetik- oder pharmazeutischen Anwendungen 
verwendet werden. 

Zur Herstellung langkettiger PUFAs mussen, wie oben erwahnt, 
die mehrfach ungesattigten Cia- bzw C2o-F®ttsauren mehrfach 
45 desaturiert werden. Die erf indungsgemaSen NukleinsM-uresequenzen 
kodieren erste funktionell aktive Desaturasen aus Phyeodactylum 
tricornutum, einem Mikroorganismus, der PUFAs in der Triacyl- 
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glycerolf raktion entha.lt. Mit den erf indungsgeinaSen Desaturasen 
konnen Doppelbindungen in die A-5-, A-6- oder A-12-Position ein- 
gefuhrt werden. Die Aktivitaten der erf indungsgemaSen Desaturasen 
fiihrt vorzugsweise zu Ci8~ + C2o~F^ttsauren mit mindestens zwei, 
5 drei, vier oder fiinf Doppelbindungen im Fettsauremolekul , vor- 
zugsweise zu C20'"Fettsauren mit vorteilhaft drei, vier oder 
fiinf Doppelbindungen im Fettsauremolekiil . Die Desaturierung kann 
vor oder nach Elongation der entsprechenden Fettsaure erfolgen. 
Daher fuhren die Produkte der Desaturaseaktivitaten und der mog- 

10 lichen weiteren Desaturieriing und Elongation zu bevorzugten PUFAs 
mit hoherem Desaturierungsgrad, einschlieSlich einer weiteren 
Elongation von C20 zu C22~Fettsauren, zu Fettsauren wie Linolsaure, 
Docosadiensaure , dihomo-y-linolensaure , Arachidonsaure , co6-Eicosa- 
triendihomo-y-linolensaure, Eicosapentaensaure, a)3-Eicosatrien- 

15 saure, a)3-Eicosatetraensaure, Docosapentaensaure oder Docosa- 
hexaensaure. Substrate dieser erf indiongsgemaSen Enzymaktivitat 
sind zum Beispiel Taxolsaure, 6 , 9-Octadecadiensaure , Olsaure, 
Linolsaure, 7-Linolensaure , Pinolensaure , a-Linolensaure, Ara- 
chidonsaure, Eicosapentaensaure oder Stearidonsaure . Bevorzugte 

20 Substrate sind Linolsaure, y-Linolensaure und/ oder a-Linolensaure, 
dihomo-y-linolensaure bzw. Arachidonsaure, Eicosatetraensaure 
oder Eicosapentaensaure. Die Cis-oder C20-Fsttsauren mit min- 
destens zwei Doppelbindungen in der Fettsaure konnen durch die 
erf indungsgemaJSe Enzymaktivitat in Form der freien Fettsaure oder 

25 in Form der Ester, wie Phospholipide, Glykolipide, Sphingolipide, 
Phosphoglyceride , Monoacylglyceride , Diacylglyceride , Tr iacylgly- 
ceride oder sonstige Ester, verlangert werden. 
Ferner mils sen Fettsauren anschlieSend an verschiedene 
Modif ikationsorte transportiert und in das Triacylglycerin- 

30 Speicherlipid eingebaut werden, Ein weiterer wichtiger Schritt 
bei der Lipidsynthese ist der Transfer von Fettsauren auf die 
polaren Kopfgruppen, beispielsweise durch Glycerin-Fettsaure- 
Acyltransf erase (siehe Frentzen, 1998, Lipid, 100 (4-5 ): 161-166 ) . 

35 Verof fentlichungen iiber die Pf lanzen-FettsSurebiosynthese, 
Desaturierung, den Lipidstof fwechsel und Membrantransport 
von fetthaltigen Verbindungen, die Betaoxidation, Fettsaure- 
modifikation und Cofaktoren, Triacylglycerin-Speicherung und 
-Assemblierung einschlieSlich der Literaturstellen darin siehe 

40 in den folgenden Artikeln: Kinney, 1997, Genetic Engeneering, 
Hrsgb. : JK Setlow, 19:149-166; Ohlrogge und Browse, 1995, Plant 
Cell 7:957-970; Shanklin und Gaboon, 1998, Annu. Rev. Plant 
Physiol. Plant Mol. Biol. 49:611-641; Voelker, 1996, Genetic 
Engeneering, Hrsgb.: JK Setlow, 18:111-13; Gerhardt, 1992, Prog. 

45 Lipid R. 31:3 97-417; Guhnemann-Schaf er Sc Kindl, 1995, Biochim. 
Biophys Acta 1256:181-186; Kunau et al . , 1995, Prog. Lipid Res. 
34:267-342; Stymne et al . , 1993, in: Biochemistry and Molecular 
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Biology of Membrane and Storage Lipids of Plants, Hrsgb. : 
Murata und Somerville, Rockville, American Society of Plant 
Physiologists, 150-158, Murphy & Ross 1998, Plant Journal. 
13(1) :1-16. 

5 

Vitamine, Cofaktoren und Nutraceutical wie PUFAs, "umfassen eine 
Gruppe von Molekulen, die hohere Tiere nicht mehr synthetisieren 
konnen und somit aufnehmen miissen oder die hohere Tiere nicht 
mehr ausreichend selbst herstellen konnen und somit zusatzlich 

10 aufnehmen miissen, obwohl sie leicht von anderen Organismen, wie 
Bakterien, synthetisiert werden. Die Biosynthese dieser Molektile 
in Organismen, die sie produzieren k5nnen, wie in Bakterien, 
ist im groiSen und ganzen charakterisiert worden (Ullmann's 
Encyclopedia of Industrial Chemistry, "Vitamins", Bd. A27, 

15 S. 443-613, VCH: Weinheim, 1996; Michal, G. (1999) Biochemical 
Pathways: An Atlas of Biochemistry and Molecular Biology, 
John Wiley & Sons; Ong, A.S., Niki, E., & Packer, L. (1995) 
"Nutrition, Lipids, Health and Disease" Proceedings of the 
UNESCO/Confederation of Scientific and Technological Associations 

20 in Malaysia and the Society for Free Radical Research Asia, 

abgehalten am 1.-3. Sept. 1994 in Penang, Malaysia, AOCS Press, 
Champaign, XL X, 374 S) . 

Die oben erwahnten Molekule sind entweder selbst biologisch 

25 aktive Molekule oder Vorstufen biologisch aktiver Substanzen, die 
entweder als Elektronenubertr^ger oder Zwischenprodukte bei einer 
Vielzahl von Stof fwechselwegen dienen. Diese Verbindungen haben 
neben ihrem Nahrwert auch einen signif ikanten industriellen Wert 
als Farbstoffe, Antioxidantien und Katalysatoren oder andere Ver- 

30 arbeitungshilf sstof fe. (Einen Uberblick liber Struktur, Aktivitat 
und Indus trielle Anwendungen dieser Verbindungen siehe z.B. 
in Ullmann's Encyclopedia of Industrial Chemistry, "Vitamins", 
Bd. A27, S. 443-613, VCH: Weinheim, 1996) . Mehrfach ungesattigte 
Fettsauren haben verschiedene Funktionen und gesundheitsf ordernde 

35 Wirkungen, beispielsweise bei koronarer Herzerkrankung, Ent- 
ziindungsmechanismen, Kinderernahrung usw. Verof f entlichungen 
und Literaturstellen, einschliei^lich darin zitierter Literatur- 
stellen, siehe in: Simopoulos, 1999, Am. J. Clin. Nutr. 70 
(3. Suppl .): 560-569, Takahata et al . , Biosc. Biotechnol . Biochem. 

40 1998, 62 (11) :2079-2085, Willich und Winther, 1995, Deutsche 
Medizinische Wochenschrif t 120(7) :229ff . 

II • Elemente und Verfahren der Erfindung 

45 Die vorliegende Erfindung beruht unter anderem auf der Entdeckung 
neuer Molekule, die hier als Desaturasenukleinsaure- und 
-proteinmolekUle bezeichnet werden, welche eine Wirkung auf 
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die Produktion von Zellmembranen und Lipiden Phaeodactyliam tri- 
cornutum ausuben und beispielsweise die Bewegung von Molekiilen 
liber diese Membranen beeinf lussen. Bei einer Ausfuhrungsf orm 
nehmen die Desaturasemolekiile am Stof fwechsel von zum Aufbau von 
5 Zellmembranen in Organismen, wie Mikroorganismen und Pflanzen, 
notwendigen Verbindungen teil oder beeinf lussen indirekt den 
Transport von Molekiilen iiber diese Membranen. Bei einer bevor- 
zugten Ausfuhrungsf orm hat die Aktivitat der erf indungsgemaSen 
Desaturasemolekiile zur Regulation der Produktion von Membran- 

10 komponenten und des Membrantransports eine Auswirkung auf 
die Produktion der gewiinschten Feinchemikalie durch diesen 
Organismus . Bei einer besonders bevorzugten Ausfuhrungsf orm 
ist die Aktivitat der erf indungsgemaj^en Desaturasemolekiile 
moduliert, so dass die Ausbeute, Produktion und/oder Effizienz 

15 der Produktion der Stof fwechselwege von Mikroorganismen oder 
Pflanzen, welche die erf indungsgemS.iSen Desaturasen regulieren, 
moduliert sind und die Effizienz des Transport von Verbindungen 
durch die Membranen verandert ist, was entweder direkt oder 
indirekt die Ausbeute, Produktion und/oder Effizienz der 

20 Produktion einer gewiinschten Feinchemikalie durch Mikroorganismen 
und Pflanzen moduliert . 

Der Begriff ''Desaturase" oder "Desaturasepolypeptid" lamfasst 
Proteine, die an der Desaturierung von Fettsauren teilnehmen. 

25 Beispiele fiir Desaturasen sind in der SEQ ID NO: 1, 3, 5, 11 
Oder ihren Homologen, Derivaten oder Analoga offenbart. Die 
Begrif f e Desaturase oder Desaturasenukleinsauresequenz (en) 
umfassen Nukleinsauresequenzen, die eine Desaturase kodieren 
und bei denen ein Teil eine kodierende Region und ebenfalls 

30 entsprechende 5'- und 3 ' -untranslatierte Sequenzbereiche sein 
konnen. Beispiele fiir Desaturase-Gene sind die in SEQ ID NO: 1, 
3, 5 oder 11 dargestellten , Die Begrif fe Produktion oder 
Produktivitat sind im Fachgebiet bekannt und beinhalten die 
Konzentration des Fermentationsproduktes (zum Beispiel der 

35 gewiinschten Feinchemikalie) / das in einer bestimmten Zeitspanne 
und einem bestimmten Fermentationsvolumen gebildet wird (z.B. 
kg Produkt pro Stunde pro Liter) . Der Begriff Effizienz der 
Produktion umfasst die Zeit, die zur Erzielung einer bestimmten 
Produktionsmenge notig ist (z.B, wie lange die Zelle zur Auf- 

40 richtung einer bestimmten Durchsatzrate einer Feinchemikalie 
benotigt) . Der Begriff Ausbeute oder Produkt /Kohlenstoff- 
Ausbeute ist im Fachgebiet bekannt und umfasst die Effizienz 
der Umwandlung der Kohlenstof f cjuelle in das Produkt (d.h. die 
Feinchemikalie) . Dies wird gewohnlich beispielsweise ausgedriickt 

45 als kg Produkt pro kg Kohlenstoff quelle . Durch Erhohen der 
Ausbeute oder Produktion der Verbindung wird die Menge der 
gewonnenen Molekiile oder der geeigneten gewonnenen Molekiile 
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dieser Verbindung in einer bestimmten Kulturmenge liber einen 
f estgelegten Zeitraum erhoht. Die Begriffe Biosynthese oder 
Biosyntheseweg sind im Fachgebiet bekannt iind umfassen die 
Synthese einer Verbindung, vorzugsweise einer organischen Ver- 
5 bindung, durch eine Zelle aus Zwischenverbindungen, beispiels- 
weise in einem Mehrschritt- iind stark regulierten Prozess. Die 
Begriffe Abbau oder Abbauweg sind im Fachgebiet bekannt iind 
umfassen die Spaltung einer Verbindung, vorzugsweise einer 
organischen Verbindung, durch eine Zelle in Abbauprodukte 

10 (allgemeiner gesagt, kleinere oder weniger komplexe Molekule) 
beispielsweise in einem Mehrschritt- und stark regulierten 
Prozess. Der Begriff Stoffwechsel ist im Fachgebiet bekannt 
und umfasst die Gesamtheit der biochemischen Reaktionen, die in 
einem Organismus stattfinden. Der Stoffwechsel einer bestimmten 

15 Verbindung (z.B. der Stoffwechsel einer Fettsaure) umfasst dann 
die Gesamtheit der Biosynthese-, Modif ikations- und Abbauwege 
dieser Verbindung in der Zelle, die diese Verbindung betreffen. 

Bei einer anderen Aus fuhrungs form konnen die erf indungsgemaSen 

20 Nukleinsauresequenzen, die fiir Desaturase-Molektile codieren, die 
Produktion eines gewtinschten Molekiils, wie einer Feinchemikalie, 
in einem Mikroorganismus oder in Pflanzen modulieren, Es gibt 
eine Reihe von Mechanismen, durch die die Veranderung einer 
erf indungsgemaJSen Sequenz die Ausbeute, Produktion und/ oder 

25 Effizienz der Produktion einer Feinchemikalie aus einem Mikro- 
organismus- oder Pf lanzenstamm, die dieses veranderte Protein 
enthalten, direkt beeinflussen kann. Die Anzahl oder Aktivitat 
von Desaturasen, die am Transport von Feinchemikalientnolekulen 
innerhalb oder aus der Zelle beteiligt sind, kann erhoht werden, 

30 so dass groiSere Mengen dieser Verbindungen iiber Membranen trans- 
port iert werden, aus denen sie leichter gewonnen und ineinander 
xamgewandelt werden. Ferner sind Fettsauren, Triacylglycerine 
und/ Oder Lipide selbst wunschenswerte Feinchemikalien; durch 
Optimierung der Aktivitat oder Steigern der Anzahl einer oder 

35 mehrerer erf indungsgemaSer Desaturasen, die an der Biosynthese 
dieser Verbindungen beteiligt sind, oder durch Storen der Aktivi- 
tat einer oder mehrerer Desaturasen, die am Abbau dieser Ver- 
bindungen beteiligt sind, kann es moglich sein, die Ausbeute, 
Produktion und/ oder Effizienz der Produktion von Fettsaure- und 

40 Lipidmolekiilen aus Organismen, wie Mikroorganismen oder Pflanzen, 
zu erhShen. 

Die Mutagenese der genannten Nukleinsauresequenzen kann Desatura- 
sen mit veranderten Aktivitat en hervorbr ingen , welche die Produk- 
45 tion einer oder mehrerer gewiinschter Feinchemikalien aus Mikroor- 
ganismen Oder Pflanzen indirekt beeinflussen. Beispielsweise kon- 
nen Desaturasen, die am Export von Abf allprodukten beteiligt 
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sind, eine groSere Anzahl oder hohere Aktivitat aufweisen, so 
dass die normalen Stof fwechselabf aile der Zelle (deren Menge mog- 
licherirtreise aufgrund der Uberproduktion der gewunschten Feinche- 
mikalie erhoht ist) effizient exportiert warden, bevor sie die 
5 Molektile in der Zelle schadigen konnen (was die Lebensf ahigkeit 
der Zelle herabsetzen wurde) oder die Feinchemikalien-Biosynthe- 
sewege storen konnen (was die Ausbeute, Produktion oder Effizienz 
der Produktion einer gewunschten Feinchemikalie senken wurde) . 
Die relativ groSen intrazellularen Mengen der gewunschten Fein- 

10 chemikalie selbst konnen ferner fur die Zelle toxisch sein, so 
dass man durch Steigern der Aktivitat oder Anzahl von Trans- 
portern, die diese Verbindungen aus der Zelle exportieren konnen, 
die Lebensf ahigkeit der Zelle in Kultur steigern kann, was wie- 
derum zu einer groiSeren Anzahl an Zellen in der Kultur fiihrt, 

15 welche die gewiinschte Feinchemikalie produzieren. Die Desaturasen 
konnen auch so manipuliert werden, dass die entsprechenden Mengen 
unterschiedlicher Lipid- und Fettsauremolekiile produziert werden. 
Dies kann eine erhebliche Auswirkung auf die Lipidzusammensetzung 
der Zellmembran haben. Da jeder Lipidtyp unterschiedliche physi- 

20 kalische Eigenschaf ten aufweist, kann eine Ver^nderung der Lipid- 
zusammensetzung einer Membran die Membranf luiditat signifikant 
verandern. Anderungen der Membranf luiditat 'konnen den Transport 
von Molekulen liber die Membran sowie die Integritat der Zelle 
beeinf lussen, was jeweils eine erhebliche Auswirkung auf die 

25 Produktion von Feinchemikalien aus Mikroorganismen und Pflanzen 
in Fermentationskultur im groSen MalSstab hat. Pf lanzemaembranen 
verleihen spezifische Eigenschaf ten, wie Toleranz gegenuber 
Warme, Kalte, Salz, Trockenheit sowie Toleranz gegen Pathogene, 
wie Bakterien und Pilze. 

30 

Die genannten isolierten Nukleinsauresequenzen sind im Genom ei- 
nes Phaeodactylum tricornutum UTEX646-Stammes enthalten, der liber 
die Algensammlung der University of Texas, Austin verfiigbar ist. 

35 Die Nukleotidsequenz der Phaeodactylum tricornutum-cDNA und die 
abgeleiteten Aminosauresequenzen der Desaturasen sind in den 
SEQ ID NO: 1 bis 6 sowie 11 und 12 gezeigt. Es wurden Computera- 
nalysen durchgef iihrt , die diese Nukleotidsequenz en als Sequenzen 
klassif izieren und/oder identif izieren, die am Stof fwechsel von 

40 Zellmembrankomponenten beteiligte Proteine oder am Transport von 
Verbindungen tiber Zellmembranen beteiligte Proteine bzw. der PUFA 
Biosynthese codieren. EST's mit der Datenbankeingabe-NO : 
PT001070010R und PT001078032R durch die Erfinder stellen die er- 
f indungsgemaSen Sequenzen in SEQ ID NO: 1 und 3 dar. Die Sequenz 

45 des Fragments aus EST PT001070010R wurde ermittelt und ist wie 
dargestellt in SEQ ID" NO: 5. Analog, ist die Sequenz des Klones 
PT001078032R dargestellt in SEQ ID NO: 1. Den Klonen wurden Gen- 
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namen zugewiesen. Abkurzungen bedeuten: Pp = Physcomitrella pa- 
tens, Pt = Phaeodactyliom tricornutum. PT00107 0010R aus SEQ ID NO: 
5 codiert ftir ein neues Gen homolog zu A-12-Desatiirase und 
PT001078032R codiert ftir eine neuartige A-5-Desaturase . Pt_des6 
5 kann gema£ Beispiel 5a mittels Polymerase Kettenreaktion unter 
Zuhilfenahme degenerierter Oligonukleotide isoliert werden. Ein 
so erhaltenes Fragment kann zum Sichten einer cDNA Bank aus 
Phaeodactyliam tricornutum isoliert werden und die codierende Re- 
gion einer Phaeodactylum tricornutum A-6-Desaturase erhalten wer- 

10 den. Ein so isoliertes Gen wird in Tabelle 1 als Pt_des6 bezeich- 
net und is-t in SEQ ID NO: 3 dargestellt. Die korrespondierenden 
Aminosauresequenzen werden durch Ubersetzung des genetischen Co- 
des der Sequenz ID NO: 1, 3 und 5 erhalten und sind als SEQ ID 
NO: 2, 4 und 6 definiert (siehe auch Tabelle 1). Auch eine wei- 

15 tere Nukleinsauresequenz , die fur eine A-12-Desaturase codiert, 
ist Tabelle 1 zu entnehmen. Sie tragt die Klon-Nummer 
PT001072031R. 

Tabelle 1 

20 



25 





Genname 


Klonname 


Nukleinsaure 
SEQ ID NO: 


Polypeptid 
SEQ ID NO: 


D5 Desaturase 


Pt_des5 


PT001078032R 


1 


2 


D6 Desaturase 


Pt_des6 


Pt_des6 


3 


4 


D12 Desaturase 


Pt_desl2 


PT001070010R 


5 


6 


D6 Desaturase 


Pp_des6 


Pp_des6 


7 


8 


D6 Elongase 


Pp_PSEl 


PP001019019F 


9 


10 


A12 Desaturase 


Pt desl2.2 


PT001072013R 


11 


12 



30 Die vorliegende Erfindung betrifft auch Proteine mit einer Amino- 
sauresequenz , die im wesentlichen homolog zu einer Aminosaure- 
sequenz der SEQ ID NO: 2, 4, 6 oder 12 ist. Wie hier verwendet, 
ist ein Protein mit einer Aminosauresequenz , die im wesentlichen 
homolog zu einer ausgewShlten Aminosauresequenz ist, zu min- 

35 destens etwa 50 % homolog zu der ausgewahlten Aminosauresequenz, 
z.B. der gesamten ausgewahlten Aminosauresequenz. Ein Protein mit 
einer Aminosauresequenz, die im wesentlichen homolog zu einer 
ausgewahlten Aminosauresequenz ist, kann auch zu mindestens etwa 
50 bis 60 %, vorzugsweise mindestens etwa 60 bis 70 % und starker 

40 bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 % oder 90 bis 

95 % und am starksten bevorzugt mindestens etwa 96 %, 97 %, 98 %, 
99 % Oder mehr homolog zu einer ausgewahlten Aminosauresequenz 
sein. 

45 Die Desaturasen oder der biologisch aktive Telle oder Fragmente 
davon konnen am Stoffwechsel von Lipiden zum Aufbau von Zellmem- 
branen oder Speicher lipiden in Organismen teilnehmen und in Kom- 
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bination mit weiteren Genen, insbesondere solchen mit Elongaseak- 
tivitat zur Elongation von Cie-bzw C20-22-PUFAS benotigten Aktivi- 
taten beitragen, so dass Cis, C20-/ C22- oder C24"PUFAs sowie ver- 
wandte PUFAs erhalten warden. 

Dabei konnen die Desaturasen in Kombination mit Elongasen \md an- 
deren Desaturasen in erf indungsgemaSen Expressionskassetten klo- 
niert warden und zur • Transformation von Pflanzen mithilfe von 
Agrobakterium eingesetzt werden. 

10 

Verschiedene Aspekte der Erfindung sind eingehender in den 
folgenden Unterabschnitten beschrieben. 

A. Isolierte Nukleinsauremolekiile 

15 

Eine Ausf iihrungsf orm der Erfindung sind isolierte Nukleinsauren, 
die von PUFA produzierenden Mikroorganismen stammen und fiir Poly- 
peptide kodieren, die Cis^-oder C2o-22-Fettsauren mit mindestens 
einer, zwei, drei oder vier Doppelbindungen in der Fettsaure 
20 desaturieren. 

Eine weitere erf indungsgemaSe Ausf iihrungsf orm sind isolierte 
Nukleinsauren, umfassend Nukleotidsequenzen, die fiir Polypeptide 
kodieren, die Cis-bzw C20-Fettsauren mit mindestens ein, zwei, 
25 drei oder vier Doppelbindungen in der Fettsaure desaturieren 
und sind aus der Gruppe, bestehend aus 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 
SEQ ID NO: 3, SEQ ID NO : 5 oder SEQ ID NO: 11 dar- 

30 gestellten Seqxienz, 

b) Nukleinsaureseqiienzen, die aufgrund des degenerierten 
genetischen Codes durch Riickubersetzung der in SEQ ID NO: 2, 
SEQ ID NO: 4, SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten 

35 Aminosauresequenzen erhalten werden, 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
Oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, die 
fur Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 

40 SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten Aminosaure- 

sequenzen codieren und mindestens 50 % Homologie auf Amino- 
saureebene aufweisen, ohne dass die enzymatische Wirkung 
der Polypeptide wesentlich reduziert ist. 



45 
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Die oben genannte erf indungsgema£e Nukleinsaure stammt von 
Organismen, wie Ciliaten, Pilzen, Algen oder Dinof lagellaten, 
die PUFAs synthetisieren konnen, vorzugsweise von Phaeodactylum 
tricornutuin oder nah verwandten Organismen. 

5 

Ein Aspekt der Erfindung betrifft isolierte Expressionskassetten 
sowie Nukleinsaureitiolekule, die Desaturase-Polypeptide oder bio- 
logisch aktive Telle davon kodieren, sowie Nukleinsauref ragmente 
von diesen, die zur Verwendung als Hybridisieriongssonden oder 

10 Primer zur Identif izierung oder Amplif izierung einer Desaturase- 
kodierenden Nukleinsaure (z.B. Desaturase-DNA) ausreichen. Der 
Begriff "Nukleinsauremolekul" , wie hier verwendet, soli DNA-Mole- 
kiile (z.B. cDNA oder genomische DNA) und RNA-Molekiile (z.B. itiRNA) 
sowie DNA- oder RNA-Analoga, die mittels Nukleotidanaloga erzeugt 

15 werden, umfassen. Dieser Begriff umfasst zudem die am 3 ' - und am 
5'-Ende des kodierenden Genbereichs gelegene untranslatierte Se- 
quenz : mindestens 500, bevorzugt 200, besonders bevorzugt 100 Nu- 
kleotide der Sequenz stromaufwarts des 5 ' -Endes des kodierenden 
Bereichs und mindestens 100, bevorzugt 50, besonders bevorzugt 20 

20 Nukleotide der Sequenz stromabwarts des 3 ' -Endes des kodierenden 
Genbereichs. Das Nukleinsauremolekul kann einzelstrangig oder 
doppelstrangig sein, ist aber vorzugsweise doppelstrangige DNA. 
Ein "isoliertes" Nukleinsauremolekul wird von anderen NukleinsSu- 
remolekiilen abgetrennt, die in der nattirliclien Quelle der Nu- 

25 kleinsaure vorliegen. Eine "isolierte" Nukleinsaure hat vorzugs- 
weise keine Sequenzen, welche die Nukleinsaure in der genomischen 
DNA des Organismus, aus dem die Nukleinsaure stammt, naturlicher- 
weise flankieren (z.B. Seqpienzen, die sich an den 5'- und 3 ' -En- 
den der NukleinsS.ure befinden) . Bei verschiedenen Ausfuhrungsf 6r- 

30 men kann das isolierte Desaturase-Nukleinsauremolekiil zum Bei- 
spiel weniger als etwa 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb oder 
0,1 kb an Nukleotidsequenzen enthalten, die natiirlicherweise das 
Nukleinsauremolekul in der genomischen DNA der Zelle, aus der die 
Nukleinsaure stammt (z.B. eine Physcomitrella patens-Zelle) 

35 flankieren. Ein "isoliertes" Nukleinsauremolekul, wie ein cDNA- 
Molekiil, kann iiberdies im wesentlichen frei von anderem zellu- 
laren Material oder Kulturmedium sein, wenn es durch rekombinante 
Techniken hergestellt wird, oder frei von chemischen Vorstuf en 
Oder anderen Chemikalien sein, wenn es chemisch synthetisiert 

40 wird. 

Ein erf indungsgemafie Expressionskassette mit der Struktur SEQ ID 
NO: 32 -Promoter- SEQ ID NO: *33, SEQ ID NO: 34 oder SEQ ID NO: 35 
Nukleinsauremolekul, z.B. ein Nukleinsauremolekul mit einer Nu- 
45 kleotidsequenz der SEQ ID NO : 1 oder eines Teils davon, kann xinter 
Verwendung molekularbiologischer Standardtechniken und der hier 
bereitgestellten Sequenz information isoliert werden. Auch kann 
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itiithilfe von Vergleichsalgorithmen beispielsweise eine homologe 
Seq;uenz oder homologe, konservierte Sequenzbereiche auf DNA oder 
Aminos aureebene identif iziert werden. Beispielsweise kann aus ei- 
ner Phaeodactylum tricornutum cDNA aus einer Phaeodactylum tri- 
5 cornutum-Bank isoliert werden, indem die vollstandige SEQ ID 
N0:1, 3, 5 oder 11 oder ein Teil davon als Hybridisierungssonde 
sowie Standard-Hybridisierungstechniken (wie z.B, beschrieben 
in Sambrook et al . , Molecular Cloning: A Laboratory Manual. 
2. Aufl., Cold Spring Harbor Laboratory, Cold Spring Harbor Labo- 

10 ratory Press, Cold Spring Harbor, NY, 1989) verwendet werden, 

Uberdies lasst sich ein Nukleinsauremolektil , umfassend eine voll- 
standige Sequenz der SEQ ID NO: 1, 3, 5 oder 11 oder einen Teil 
davon, durch Polymerasekettenreaktion isolieren, wobei Oligonu- 
kleotidprimer , die auf der Basis dieser Sequenz oder von Teilen 

15 davon, insbesondere Regionen im Motive aus Beispiel 5a erstellt 
werden oder Modif ikationen ebensolcher in einzelnen definierten 
Aminosauren, veirwendet werden (z.B. kann ein Nukleinsauremolekiil , 
umfassend die vollstandigen Sequenz der SEQ ID N0:1, 3, 5 oder 11 
Oder einen Teil davon, durch Polymerasekettenreaktion unter Ver- 

20 wendung von Oligonukleotidprimern isoliert werden, die auf der 
Basis dieser gleichen Sequenz der SEQ ID NO : 1, 3, 5 oder 11 er- 
stellt worden sind) . Zum Beispiel lasst sich mENA aus Zellen iso- 
lieren (z.B. durch das Guanidiniximthiocyanat-Extraktionsverf ahren 
von Chirgwin et al . (1979) Biochemistry 18:5294-5299) und cDNA 

25 mittels Reverser Transkriptase (z.B. Moloney-MLV-Reverse-Trans- 
kriptase, erhaltlich von Gibco/BRL, Bethesda, MD, oder AMV-Re- 
verse-Transkriptase, erhaltlich von Seikagaku America, Inc., 
St . Petersburg, FL) herstellen. Synthetische Oligonukleotidprimer 
zur Amplif izierung mittels Polymerasekettenreaktion lassen sich 

30 auf der Basis einer der in SEQ ID NO: 1, 3, 5 oder 11 sowie der 
in Figur 5a gezeigten Seq[uenzen oder mithilfe der in SEQ ID NO: 
2, 4, 6 Oder 12 dargestellten Aminosauresequenzen erstellen. Eine 
erf indungsgemaSe Nukleinsaure kann unter Verwendung von cDNA 
oder alternativ von genomischer DNA als Matrize \xnd geeigneten 

35 Oligonukleotidprimern gemaS Standard~PCR-Amplif ikationstechniken 
amplif iziert werden. Die so amplif izierte Nukleinsaure kann in 
einen geeigneten Vektor kloniert werden und mittels DNA-Sequenz- 
analyse charakterisiert werden. Oligonukleotide, die einer 
Desaturase-Nukleotidsequenz entsprechen, konnen durch Standard- 

40 Synthes ever f ahren, beispielsweise mit einem automatischen DNA- 
Synthesegerat , hergestellt werden. 

Die in SEQ ID NO: 1,3, 5 oder 11 gezeigte cDNA umfasst Sequenzen, 
die Desaturasen kodieren, (d.h. den "kodierenden Bereich" ) sowie 
45 5 ' -untranslatierte Sequenzen und 3 ' -xintranslatierte Sequenzen. 
Alternativ kann das Nukleinsauremolekiil nur den kodierenden 
Bereich einer der Sequenzen in SEQ ID NO: 1, 3, 5 oder 11 um- 
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fassen oder kann ganze genomische Fragmente, die aus genomischer 
DNA isoliert sind, enthalten. 

Bei einer weiteren bevorzugten Aus fuhrungs form umfasst ein 
5 erf indungsgemaSes isoliertes Nukleinsauremolekiil ein Nuklein- 
sauremolekul, das ein Komplement einer der in SEQ ID NO: 1, 3, 5 
Oder 11 gezeigten Nukleotidsequenzen oder eines Teils davon ist. 
Ein Nukleinsauremolekiil, das zu einer der in SEQ ID NO: 1, 3, 5 
oder 11 gezeigten Nukleotidsequenzen komplementar ist, ist dann 
10 ausreichend komplementar, wenn es mit einer der in SEQ ID NO: 1, 
3, 5 oder 11 angegebenen Sequenzen hybridisieren kann, wodurch 
ein stabiler Duplex entsteht. 

Homologe der neuen Desaturase-Nukleinsauresequenzen mit der 

15 Seqxienz SEQ ID NO: 1, 3, 5 oder 11 bedeutet beispielsweise 

allelische Varianten mit mindestens etwa 50 bis 60 %, vorzugs- 
weise mindestens etwa 60 bis 7 0 %, starker bevorzugt mindestens 
etwa 70 bis 80 %, 80 bis 90 % oder 90 bis 95 % und noch starker 
bevorzugt mindestens etwa 95 %, 96 %, 97 %, 98 %, 99 % oder 

20 melir Homologie zu einer in SEQ ID NO: 1, 3, 5 oder 11 gezeigten 
Nukleotidsequenzen oder ihren Homologen, Derivaten oder Analoga 
Oder Teilen davon. Bei einer weiteren bevorzugten Aus fuhrungs form 
imfasst ein isoliertes erf indungsgemaSes Nukleinsauremolekiil eine 
Nukleotidsequenz, die an eine der in SEQ ID NO: 1, 3, 5 oder 11 

25 gezeigten Nukleotidsequenzen oder einen Teil davon hybridisiert , 
z.B. unter stringenten Bedingungen hybridisiert. Allelische 
Varianten iimfassen insbesondere funktionelle Varianten, die 
sich durch Deletion, Insertion oder Substitution von Nukleotiden 
aus/in der in SEQ ID NO: 1, 3, 5 oder 11 dargestellten Sequenz 

30 erhalten lassen, wobei aber die Absicht ist, dass die Enzym- 
aktivitat der davon herriihrenden synthetisierten Proteine fiir 
die Insertion eines oder mehrerer Gene vorteilhaf terweise bei- 
behalten wird. Proteine, die noch die enzymatische Aktivitat der 
Desaturase besitzen, das heiiSt deren Aktivitat im wesentlichen 

35 nicht reduziert ist, bedeutet Proteine mit mindestens 10 %, vor- 
zugsweise 20 %, besonders bevorzugt 30 %, ganz besonders bevor- 
zugt 40 % der urspriinglichen Enzymaktivitat , verglichen mit dem 
durch SEQ ID NO: 2, 4, 6 oder 12 kodierten Protein. 

40 Homologen der SEQ ID NO: 1, 3, 5 oder 11 bedeuten beispiels- 
weise auch bakterielle, Pilz- und Pf lanzenhomologen, verkurzte 
Sequenzen, einzelstrangige DNA oder RNA der kodierenden lond 
nicht -kodierenden DNA-Sequenz . 

45 Homologen der SEQ ID NO: 1, 3, 5 oder 11 bedeutet auch 

Derivate, wie beispielsweise Promotorvarianten. Die Promotoren 
stromaufwarts der angegebenen Nukleotidsequenzen konnen durch 
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einen oder mehrere Nukleotidaustausche, durch Insertion (en) 
und/oder Deletion(en) modifiziert werden, ohne dass jedoch die 
Funktionalitat oder Aktivitat der Promotoren gestort wird. Es 
ist weiterhin moglich, dass die Aktivitat der Promotoren durch 
5 Modifikation ihrer Sequenz erhoht ist oder dass sie vollstandig 
durch aktivere Promotoren, sogar aus heterologen Organismen, 
ersetzt werden. 

Uberdies kann das erf indungsgemaiSe Nukleinsauremolekiil nur 

10 einen Teil des kodierenden Bereichs einer der Sequenzen in 

SEQ ID NO: 1, 3, 5 oder 11 umfassen, zum Beispiel ein Fragment, 
das als Sonde oder Primer verwendet werden kann, oder ein 
Fragment, welches einen biologisch aktiven Abschnitt einer 
Desaturase kodiert. Die aus der Klonierung des Desaturase-Gens 

15 von Phaeodactylum tricornutum ermittelten Nukleotidsequenzen 

ermoglichen die Erzeugung von Sonden und Primern, die zur Identi- 
fizierung und/oder Klonierung von Desaturase-Homologen in anderen 
Zelltypen und Organismen sowie Desaturase-Homologen aus anderen 
Mikroalgen oder verwandten Arten gestaltet sind. Die Sonde/der 

20 Primer umfasst gewohnlich im wesentlichen gereinigtes Oligo- 

nukleotid. Das Oligonukleotid ucnfasst gewohnlich einen Nukleotid- 
sequenzbereich, der unter stringent en Bedingungen an mindestens 
etwa 12, vorzugsweise etwa 16, starker bevorzugt etwa 25, 40, 50 
Oder 75 auf einanderf olgende Nukleotide eines Sense-Stranges einer 

25 der in SEQ ID NO: 1, 3, 5 oder 11 angegebenen Sequenzen, eines 
Antisense-Stranges einer der in SEQ ID NO: 1, 3, 5 oder 11 an- 
gegebenen Sequenzen oder seiner Homologen, Derivate oder Analoga 
Oder naturlich vorkommender Mutanten davon hybridisiert . Primer 
auf der Basis einer Nukleotidsequenz der SEQ ID NO: 1, 3, 5 

30 Oder 11 konnen in PCR-Reaktionen zur Klonierung von Desaturase- 
Homologen verwendet werden. Sonden auf der Basis der Desaturase- 
Nukleotidsequenzen konnen zum Nachweis von Transkripten oder 
genomischen Sequenzen, die das gleiche oder homologe Proteine 
kodieren, veorwendet werden. Bei bevorzugten Ausfiihrungsf oinnen 

35 umfasst die Sonde zudem eine daran gebundene Markierungsgruppe, 
z.B. ein Radioisotop, eine f lucres zierende Verbindung, ein Enzym 
Oder einen Enzym-Cof aktor . Diese Sonden konnen als Teil eines 
Test-Kits fur genomische Marker zur Identif izierung von Zellen, 
die eine Desaturase misexprimieren, beispielsweise durch Messen 

40 einer Menge einer Desaturase-kodierenden Nukleinsaure in einer 
Zellenprobe, z.B. Messen der Desaturase-mRNA- Spiegel , oder zur 
Bestimmung, ob ein genomisches Desaturase-Gen mutiert oder 
deletiert ist, veirwendet werden. 

45 Bei einer Aus fiihrungs form kodiert das erf indungsgemaSe Nuklein- 
sauremolektil ein Protein oder einen Teil davon, das/der eine 
Aminosauresequenz umfasst, die ausreichend homolog zu einer 
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Aminosauresequenz der SEQ ID NO: 2, 4, 6 oder 12 ist, dass das 
Protein oder der Teil davon die Fahigkeit, am Stoffwechsel von 
zum Aufbau von Zellmembranen in Mikroorganismen oder Pflanzen 
notwendigen Verbindungen oder am Transport von Molekiilen iiber 
5 diese Membranen teilzunehmen, beibehalt. Wie hier verwendet, 
betrifft der Begriff "ausreichend homolog" Proteine oder Teile 
davon, deren Aminosauresequenzen eine minimale Anzahl identischer 
Oder aqiiivalenter Aminosaurereste (z.B. einen Aminosaurerest 
mit einer ahnlichen Seitenkette, wie ein Aminosaurerest in 

10 einer der Sequenzen der SEQ ID NO: 2) zu einer Aminosauresequenz 
der SEQ ID NO: 2 aufweisen, so dass das Protein oder der Teil 
davon am Stoffwechsel von zum Aufbau von Zellmembranen in Mikro- 
organismen Oder Pflanzen notwendigen Verbindungen oder am Trans- 
port von Molekiilen uber diese Membranen teilnehmen kann. Protein- 

15 bestandteile dieser Stof fwechselwege ftir Membrankomponenten 
Oder Membrantransportsysteme konnen, wie hier beschrieben, 
eine Rolle bei der Produktion und Sekretion einer oder mehrerer 
Feinchemikalien spielen. Beispiele fiir diese Aktivitaten sind 
hier ebenfalls beschrieben. Somit tragt die "Funktion einer 

20 Desaturase" entweder direkt oder indirekt zur Ausbeute, Pro- 
duktion und/oder Ef fizienz der Produktion einer oder mehrerer 
Feinchemikalien bei. Beispiele fiir Desaturase-Substratspezif i- 
taten der katalytischen Aktivitat sind in Tabelle 5 und 6 
angegeben . 

25 

Bei einer weiteren Ausf uhrungsf orm kodieren Derivate des 
erf indungsgema£en Nukleinsauremolekiils Proteine mit mindestens 
etwa 50 bis 60 %, vorzugsweise mindestens etwa 60 bis 70 % und 
starker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 %, 

30 90 bis 95 % und am starksten bevorzugt mindestens etwa 96 %, 
97 %, 98 %, 99 % Oder mehr Homologie zu einer vollstandigen 
Amino sauresequenz der SEQ ID N0:2. Die Homologie der Aminosaure- 
sequenz kann uber den gesamten Sequenzbereich mit dem Programm 
PileUp (0*. Mol. Evolution., 25, 351-360, 1987, Higgins et al . , 

35 CABIOS, 5, 1989:151-153) oder BESTFIT oder GAP bestimmt 

(Henikoff , S, and Henikoff , J. G. (1992) . Amino acid substitution 
matrices from protein blocks. Proc . Natl. Acad. Sci. USA 89: 
10915-10919.) 

40 Teile von Proteinen, die von den erf indungsgemaSen Desaturase- 
Nukleinsauremolekulen kodiert werden, sind vorzugsweise bio- 
logisch aktive Teile einer der Desaturasen. Wie hier verwendet, 
soli der Begriff "biologisch aktiver Teil einer Desaturase", 
einen Abschnitt, z.B. eine Domane/ein Motiv, einer Desaturase 

45 umfassen^ der am Stoffwechsel von z\im Aufbau von Zellmembranen 
in Mikroorganismen oder Pflanzen notwendigen Verbindungen oder 
am Transport von Molekulen tiber diese Membranen teilnehmen kann 
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Oder eine in Tabelle 5 und 6 angegebene Aktivitat aufweist. Zur 
Bestiinmung; ob eine Desaturase oder ein biologisch aktiver Teil 
davon am Stof fwechsel von zuin Aufbau von Zellmembranen in Mikro- 
organismen oder Pf lanzen notwendigen Verbindungen oder am Trans- 
5 port von Molekiilen liber diese Membranen teilnehmen kann, kann 
ein Test der enzymatischen Aktivitat durchgefuhrt werden. Diese 
Testverf ahren, wie eingehend in Beispiel 8 des Beispielteils 
beschrieben, sind dem Fachmann gelaufig. 

10 Zusatzliche Nukleinsaurefragmente, die biologisch aktive 
Abschnitte einer Desaturase kodieren, lassen sich durch 
Isolierung eines Teils einer der Sequenzen in SEQ ID NO: 1, 3, 
5 oder 11, Exprimieren des kodierten Abschnitt der Desaturase 
oder des Peptids (z.B. durch rekombinante Expression in vitro) 

15 und Bestimmen der Aktivitat des kodierten Teils der Desaturase 
Oder des Peptids herstellen. 

Die Erfindung umfasst zudem Nukleinsauremolekiile, die sich 

von einer der in SEQ ID NO: 1, 3, 5 oder 11 gezeigten Nukleotid- 

20 sequenzen (und Teilen davon) aufgrund des degenerierten 

genetischen Codes unterscheiden und somit die gleiche Desaturase 
kodieren wie diejenige, die von den in SEQ ID NO: 1, 3, 5 oder 11 
gezeigten Nukleotidseqxienzen kodiert wird. Bei einer anderen Aus- 
fuhrungsform hat ein erf indungsgemaJles isoliertes Nukleinsaure- 

25 molekiil eine Nukleotidseguenz, die fiir ein Protein mit einer in 
SEQ ID NO: 2, 4, 6 oder 12 gezeigten Aminos aures equ en z kodiert. 
Bei einer weiteren Ausfiihrungsf orm kodiert das erf indungsgemaSe 
Nukleinsauremolekul ein Vollangen-Desaturase-Protein, das zu 
einer Aminosauresequenz der SEQ ID NO: 2,4, 6 oder 12 (die 

30 von einem in SEQ ID NO: 1, 3, 5" oder 11 gezeigten offenen 

Leseraster kodiert wird) im wesentlichen homolog ist und durch 
gangige Methoden identif izierbar und isolierbar ist. 

Zusatzlich zu den in SEQ ID NO: 1, 3, 5 oder 11 gezeigten 
35 Desaturase-Nukleotidsequenzen erkennt der Fachmann, dass DNA- 
Sequenzpolymorphismen, die zu Anderungen in den Aminosaure- 
sequenzen der Desaturasen fiihren, innerhalb einer Population 
(z.B. der Phaeodactylum tricornutum-Population) existieren 
konnen. Diese genetischen Polymorphismen im Desaturase-Gen konnen 
40 zwischen Individuen innerhalb einer Population aufgrund von 

natiirlicher Variation existieren. Wie hier verwendet, bedeuten 
die Begriffe "Gen" und "rekombinantes Gen" Nukleinsauremolekule 
mit einem offenen Leserahmen, der eine Desaturase, vorzugsweise 
eine Phaeodactylum tricornutum -Desaturase, kodiert. Diese natiir- 
45 lichen Varianten bewirken ublicherweise eine Varianz von 1 bis 
5 % in der Nukleotidsequenz des Desaturase-Gens . Samtliche 
und alle dieser Nukleotidvariationen und daraus resultierende 
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Aminosaurepolymorphismen in der Desaturase, die das Ergebnis 
naturlicher Variation sind und die f iinktionelle Aktivitat von 
Desaturasen nicht verandern, sollen im Umfang der Erfindung 
enthalten sein . 

5 

Nukleinsauremolekiile, die den natiirlichen Varianten entsprechen, 
und nicht-Phaeodactylum tricornutiaiu-Homologen, -Derivate und 
-Analoga der Phaeodactylum tricornutum-cDNA konnen auf der 
Grundlage ihrer Homologie zu der hier of fenbarten Phaeodactylum 

10 tricornutuiti-Desaturase-Nukleinsaure unter Verwendung der Phaeo- 
dactylum tricornutum-cDNA oder eines Teils davon als Hybrid!- 
sierungssonde gemail> Standard-Hybridisierungstechniken unter 
stringenten Hybridisierungsbedingungen isoliert werden. Bei einer 
anderen Ausfuhrungsf orm ist ein erf indungsgemaiSes isoliertes 

15 Nukleinsauremolekul mindestens 15 Nukleotide lang und hybridi- 
siert unter stringenten Bedingungen mit dem Nukleinsauremolekul, 
das eine Nukleotidsecjuenz der SEQ ID N0:1, 3, 5 oder 11 xomfasst. 
Bei anderen Ausfuhrungsf ormen ist die Nukleinsaure mindestens 25, 
50, 100, 250 Oder mehr Nukleotide lang. Der Begriff "hybridisiert 

20 unter stringenten Bedingungen", wie hier verwendet, soil Hybridi- 
sierungs- und Waschbedingungen beschreiben, unter denen Nukleo- 
tidsequenzen, die mindestens 60 % homolog zueinander sind, ge- 
wohnlich aneinander hybridisiert bleiben. Die Bedingungen sind 
vorzugsweise derart, dass Sequenzen, die mindestens etwa 65 %, 

25 starker bevorzugt mindestens etwa 70 % und noch starker bevor- 
zugt mindestens etwa 75 % oder starker zueinander homolog sind, 
gewohnlich aneinander hybridisiert bleiben. Diese stringenten 
Bedincfungen sind dem Fachmann bekannt und lassen sich in Current 
Protocols in Molecular Biology, John Wiley & Sons, N. Y. (1989), 

30 6.3. 1-6 .3.6., f inden . Ein bevorzugtes , nicht einschrankendes 

Beispiel fiir stringente Hybridisierungsbedingungen sind Hybridi- 
sierungen in 6 x Natriumchlorid/Natriumcitrat (sodiuim chloride/ 
sodiumcitrate = SSC) bei etwa 45 °C, gefolgt von einem oder 
mehreren Waschschritten in 0,2 x SSC, 0,1 % SDS bei 50 bis 65°C. . 

35 Dem Fachmann ist bekannt, dass diese Hybridisierungsbedingungen 
sich je nach dem Typ der Nukleinsaure und, wenn beispielsweise 
organische L6sungsmittel vorliegen, hinsichtlich der Temperatur 
und der Konzentration des Puffers unterscheiden. Die Temperatur 
unterscheidet sich beispielsweise unter "Standard-Hybridi- 

40 sierungsbeding-ungen" je nach dem Typ der Nukleinsaure zwischen 
42°C und 58°C in wassrigem Puffer mit einer Konzentration von 0,1 
bis 5 X SSC (pH 1,2). Falls organisches Losungsmittel im oben- 
genannten Puffer vorliegt, zum Beispiel 50 % Formamid, ist die 
Temperatur unter Standardbedingungen etwa 42°C. Vorzugsweise sind 

45 die Hybridisierungsbedingungen fiir DNAiDNA-Hybride zum Beispiel 
0,1 X SSC und 20°C bis 45°C, vorzugsweise zwischen 30°C und 45°C. 
Vorzugsweise sind die Hybridisierungsbedingungen fur DNArRNA- 
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Hybride zum Beispiel 0,1 x SSC und 30°C bis 55°C, vorzugsweise 
zwischen 45°C und 55°C. Die vorstehend genannten Hybridisierungs- 
temperaturen sind beispielsweise fiir eine Nukleinsaure mit etwa 
100 bp (= Basenpaare) Lange und einem G + C-Gehalt von 50 % 
5 in Abwesenheit von Formamid bestiirant, Der Fachmann weiS, wie 
die erf orderlichen Hybridisierungsbedingungen anhand von Lehr- 
buchern, wie dem vorstehend erwahnten oder aus den folgenden 
Lehrbuchern Sambrook et al . , "Molecular Cloning", Cold Spring 
Harbor Laboratory, 1989; Haines und Higgins (Hrsgb.) 1985, 
10 ''Nucleic Acids Hybridization: A Practical Approach", IRL Press at 
Oxford University Press, Oxford; Brown (Hrsgb.) 1991, "Essential 
Molecular Biology: A Practical Approach", IRL Press at Oxford 
University Press, Oxford, bestimmt werden konnen. 

15 Vorzugsweise entspricht ein erf indungsgemaSes isoliertes Nuklein- 
sauremolekul, das unter stringenten Bedingungen an eine Sequenz 
der SEQ ID N0:1, 3, 5 oder 11 hybridisiert , einem natiirlich vor- 
kommenden Nukleinsauremolekul . Wie hier verwendet, betrifft ein 
"natiirlich vorkommendes/' Nukleinsauremolekxil ein RNA- oder DNA- 

20 Molektil mit einer Nukleotidsequenz , die in der Natur vorkommt 

(z.B. ein natiirliches Protein kodiert) . Bei einer Aus fuhrungs form 
kodiert die Nukleinsaure eine naturliche vorkommendes Phyaeo- 
dactylum tricornutum-Desaturase . 

25 ZusM.tzlich zu naturlich vorkommenden Varianten der Desaturase- 
sequenz, die in der Population existieren konnen, erkennt der 
Fachmann ferner, dass auch Anderungen durch Mutation in eine 
Nukleotidsequenz der SEQ ID NO: 1, 3, 5 oder 11 eingebracht 
werden konnen, was zu Anderungen der Aminosauresequenz der 

30 kodierten Desaturase fiihrt, ohne dass die Funktionsf ahigkeit 
des Desaturaseproteins beeintrachtigt wird. Beispielsweise 
lassen sich Nukleotidsusbtitutionen, die an "nicht-essentiellen" 
Aminos aureres ten zu Atninosauresubstitutionen fuhren, in einer 
Sequenz der SEQ ID NO; 2, 4, 6 oder 12 herstellen. Ein "nicht- 

35 essentieller" Aminos^urerest ist ein Rest, der sich in einer 

Wildtyp-Desaturasequenz einer der Desaturasen (SEQ ID NO: 2, 4, 6 
oder 12) verandern lasst, ohne dass die Aktivitat der Desaturase 
verandert das heiSt wesentlich reduziert wird, wohingegen ein 
"essentieller" Aminosaurerest fiir die Desaturaseaktivitat 

40 erforderlich ist. Andere Aminosaurereste (z.B. diejenigen, die 
in der Domane mit Desaturaseaktivitat nicht konserviert oder 
lediglich semikonserviert sind) konnen jedoch fiir die Aktivitat 
nicht essentiell sein und lassen sich somit verandern, ohne dass 
die Desaturaseaktivitat verandert wird. 
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Folglich betrifft ein weiterer Aspekt der Erfindung Nuklein- 
saureraolekille, die Desaturasen kodieren, die veranderte Amino- 
saurereste enthalten, die fiir die Desaturaseaktivitat nicht 
essentiell sind. Diese Desaturasen unterscheiden sich in der 
5 Aminosauresequenz von einer Sequenz in SEQ ID NO: 2, 4, 6 oder 
12 und behalten dennoch zuitiindest eine der hier beschriebenen 
Desaturaseaktivitaten. Das isolierte Nukleinsauremolekul umfasst 
bei einer Ausf lihrungsf orm eine Nukleotidsequenz , die ein Protein 
kodiert, wobei das Protein eine Aminosauresequenz mit mindestens 

10 etwa 50 % Homologie zu einer Aminosauresequenz der SEQ ID NO: 2, 
4, 6 Oder 12 umfasst und am Stoffwechsel von zum Aufbau von Zell- 
membranen in Phaeodactylum tricornutum notwendigen Verbindungen 
Oder am Transport von Molekulen uber diese Membranen teilnehmen 
kann. Das von dem Nukleinsauremolekul kodierte Protein ist 

15 vorzugsweise mindestens etwa 50 bis 60 % homolog zu einer der 
Sequenzen in SEQ ID NO: 2, 4, 6 oder 12 starker bevorzugt min- 
destens etwa 60 bis 70 % homolog zu einer der Sequenzen in 
SEQ ID NO: 2, 4, 6 oder 12 noch starker bevorzugt mindestens 
etwa 70 bis 80 %, 80 bis 90 %, 90 bis 95 % homolog zu einer 

20 der Sequenzen in SEQ ID NO: 2, 4, 6 oder 12 und am starksten 
bevorzugt mindestens etwa 96 %, 97 %, 98 % oder 99 % homolog 
zu einer der Sequenzen in SEQ ID NO: 2, A, 6 oder 12. 

Zur Bestimmung der prozentualen Homologie von zwei Aminosaure- 

25 sequenzen (z.B. einer der Sequenzen der SEQ ID NO: 2, 4, 6 oder 
12 und einer mutierten Form davon) oder von zwei Nukleinsauren 
werden die Sequenzen zum Zweck des optimalen Vergleichs xinter- 
einander geschrieben (z.B. }^6imen Liicken in die Sequenz eines 
Proteins oder einer Nukleinsaure eingefiigt werden, um ein opti- 

30 males Alignment mit dem anderen Protein oder der anderen Nuklein- 
saure zu erzeugen) . Die Aminosaurereste oder Nukleotide an den 
entsprechenden Aminosaurepositionen oder Nukleotidpositionen 
werden dann verglichen. Wenn eine Position in einer Sequenz (z.B. 
einer der Sequenzen der SEQ ID NO: 2, 4, 6 oder 12) durch den 

35 gleichen Aminosaurerest oder das gleiche Nukleotid wie die ent- 
sprechende Stelle in der anderen Sequenz (z.B. einer mutierten 
Form der aus SEQ ID NO: 2, 4, 6 oder 12 ausgewahlten Sequenz) 
belegt wird, dann sind die Molektile an dieser Position homolog 
(d.h. Aminosaure- oder Nukleinsaure-^'Homologie" , wie hier ver- 

40 wendet, entspricht Aminosaure- oder Nukleinsaure-" Identi tat" ) . 
Die prozentuale Homologie zwischen den beiden Sequenzen ist 
eine Funktion der Anzahl an identischen Positionen, die den 
Sequenzen gemeinsam sind (d.h. % Homologie = Anzahl der 
identischen Positionen/Gesamtanzahl der Positionen x 100) . 

45 Die Begriffe Homologie und Identitat sind damit als Synonym 
anzusehen. 
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Ein isoliertes Nukleinsaureitiolekul , das eine Desaturase kodiert, 
die zu einer Proteinsequenz der SEQ ID NO: 2, 4, 6 oder 12 homo- 
log 1st, kaiin durch Einbringen einer oder mehrerer Nukleotid- 
substitutionen, -additionen oder -deletionen in eine Nukleotid- 
5 seqijenz der SEQ ID NO: 1, 3, 5 oder 11 erzeugt werden, so 
dass eine oder mehrere Aminosauresubstitutionen, -additionen 
Oder -deletionen in das kodierte Protein eingebracht werden. 
Mutationen konnen in eine der Sequenzen der SEQ ID NO: 1, 3, 5 
Oder 11 durch Standardtechniken, wie stellenspezif ische Muta- 

10 genese und PCR-vermittelte Mutageneses eingebracht werden. 
Vorzugsweise werden konservative Aminosauresubstitutionen an 
einer oder mehreren der vorhergesagten nicht-essentiellen Ainino- 
saureresten hergestellt. Bei einer "konservativen Aminosaure- 
substitution" wird der AtninosSurerest gegen einen Aminos aurer est 

15 mit einer Shnlichen Seitenkette ausgetauscht . Im Fachgebiet 
sind Familien von Aminos aureres ten mit ahnlichen Seitenketten 
definiert worden. Diese Familien umfassen Aminosauren mit 
basischen Seitenketten (z.B. Lysin, Arginin, Histidin) , sauren 
Seitenketten (z.B. Asparaginsaure, Glutaminsaure) , ungeladenen 

20 polaren Seitenketten (z.B. Glycin, Asparagin, Glutamin, Serin, 
Threonin, Tyrosin, Cystein) , unpolaren Seitenketten, (z.B. 
Alanin, Valin, Leucin, Isoleucin, Prolin, Phenylalanin, 
Methionine Tryptophan), beta-verzweigten Seitenketten (z.B. 
Threonin, Valin, Isoleucin) und aromatischen Seitenketten (z.B. 

25 Tyrosin, Phenylalanin, Tryptophan, Histidin) . Ein vorhergesagter 
nicht-essentieller Aminosaurerest in einer Desaturase wird somit 
vorzugsweise durch einen anderen Aminosaurerest aus der gleichen 
Seitenkettenf amilie ausgetauscht- Alternativ konnen bei einer 
anderen Aus fuhrungs form die Mutationen zuf allsgemaiS liber die 

30 gesamte oder einen Teil der Desaturase-kodierenden Sequenz ein- 
gebracht werden, z.B. durch Sattigungsmutagenese, und die resul- 
tierenden Mutanten konnen nach der hier beschriebenen Desaturase- 
Aktivitat durchmustert werden, um Mutanten zu identif izieren, 
die Desaturaseaktivitat beibehalten. Nach der Mutagenese einer 

35 der SBq[O.Gnzoix der SEQ ID NO: 1, 3, 5 oder 11 kann das kodierte 
Protein rekombinant exprimiert werden, und die Aktivitat des 
Proteins kann z.B. unter Verwendung der hier beschriebenen Tests 
(siehe Beispielteil) bestimmt werden. 

40 Zusatzlich zu den Nukleinsauremolekulen, welche die vorstehend 
beschriebenen Desaturasen kodieren, betrifft ein weiterer Aspekt 
der Erfindung isolierte Nukleinsauremolekule, die "Antisense" 
zu den erf indungsgemaSen Nukleinsauresequenzen sind. Eine "Anti- 
sense'^-Nukleinsaure umfasst eine Nukleotidsequenz, die zu einer 

45 " Sense "-Nukleinsaure, welche ein Protein kodiert, komplementar 
ist, z.B- komplementar zum kodierenden Strang eines doppel- 
strangigen cDNA-Molek"£ils oder komplementar zu einer mRNA-Sequenz . 
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Eine Antisense-Nukleinsaure kann folglich. xiber Wasserstof f- 
brtickenbindungen an eine Sense-Noikleinsaure binden. Die Anti- 
sense-Nukleinsaure kann zu einem gesamten Desaturase-kodierenden 
Strang oder nur zu einem Teil davon komplementar sein. Bei einer 
5 Ausftilirungsf oinu ist ein Antisense-Nukleinsauremolekul "Antisense" 
zu einem "kodierenden Bereich" des kodierenden Strangs einer 
Nukleotidsequenz , die eine Desaturase kodiert, Der Begriff 
"kodierender Bereich" betrifft den Bereich der Nukleotidsequenz , 
der Codons umfasst, die in Aminosaurereste translatiert werden 

10 (z.B. den gesamten kodierenden Bereich, der mit dem Stopcodon 
beginnt und endet, d,h. dem letzten Codon vor dem Stopcodon) . 
Bei einer weiteren Ausfuhrungsf orm ist das Antisense-Nuklein- 
sauremolekiil "Antisense" zu einem "nicht-kodierenden Bereich" 
des kodierenden Strangs einer Nukleotidsequenz , die Desaturase 

15 kodiert. Der Begriff "nicht-kodierender Bereich" betrifft 5'- 
xind 3 ' -Sequenzen, die den kodierenden Bereich flankieren und 
nicht in Aminosauren translatiert werden (d.h. die man auch 
als 5'- und 3 ' -untranslatierte Bereiche bezeichnet) . 

20 Unter Voraussetzung der hier offenbarten Desaturase-kodierenden 
Sequenzen des kodierenden Stranges (z.B. die in SEQ ID NO: 1, 
3, 5 Oder 11 dargestellten Sequenzen) konnen erf indungsgemaSe 
Antisense-Nukleinsauren gemaS den Regeln der Watson-Crick-Basen- 
paarung gestaltet werden. Das Antisense-Nukleinsauremolekul kann 

25 komplementar zum gesamten kodierenden Bereich von Des a tur as e-mRNA 
sein, ist aber starker bevorzugt ein Oligonukleotid, das nur zu 
einem Teil des kodierenden oder nicht-kodierenden Bereichs von 
Desaturase-mRNA "Antisense" ist. Das Antisense-Oligonukleotid 
kann z.B. zu dem Bereich, der die Translationsstartstelle von 

30 Desaturase-mRNA umgibt, komplementar sein. Ein Antisense-Oligo- 
nukleotid kann z.B. etwa 5, 10, 15, 20, 25, 30, 35, 40, 45 oder 
50 und mehr Nukleotide lang sein. Eine erf indungsgemaSe Anti- 
sense-Nukleinsaure kann unter Verwendung chemischer Synthese und 
enzymatischer Ligationsreaktionen mittels im Fachgebiet bekannter 

35 Verfahren konstruiert werden. Eine Antisense-Nukleinsaure (z.B. 
ein Antisense-Oligonukleotid) kann z.B. chemisch synthetisiert 
werden, wobei naturlich vorkommende Nukleotide oder verschiedent- 
lich modifizierte Nukleotide verwendet werden, die so gestaltet 
sind, dass sie die biologische Stabilitat der Molekiile erhohen 

40 oder die physikalische Stabilitat des zwischen der Antisense- und 
der Sense-Nukleinsaure gebildeten Duplexes erhohen, beispiels- 
weise konnen Phosphorthioat-Derivate und acridinsubstituierte 
Nukleotide verwendet werden. Beispiele fixr modifizierte Nukleo- 
tide, die zur Erzeugung der Antisense-Nukleinsaure verwendet 

45 werden konnen, sind u.a. 5-Fluoruracil , 5-Bromuracil, 5-Chlor- 
uracil, 5-Ioduracil, Hypoxanthin, Xanthin, 4-Acetylcytosin, 
5- ( Carboxyhydroxylmethyl ) uracil , 5-Carboxymethylaminomethyl-2- 
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thiouridin , S-Carboxymethylaminomethyluracil , Dihydrouracil , 
Beta~D-Galactosylqueosin, Inosin, N6-Isopentenyladenin, 1-Methyl- 
guanin, l-Methylinosin, 2, 2-Diinethylguanin, 2-Methyladenin, 
• 2-Methylg-uaiiin, 3-Methylcytosin, 5-Methylcytosin, N6-Adenin, 
5 V-Metliylguaniri/ S-Methylaminomethyluracil, S-Methoxyaminomethyl- 
2-thiouracil , Beta-D-Mannosylqueosin, 5 ' -Methoxycarboxymethyl- 
uracil, 5-Methoxyuracil , 2-Methylthio~N6-isopentyladenin, Uracil- 
5-oxyessigsaure (v) , Wybutoxosin, Desaturaseudouracil , Queosin, 
2-Thiocytosin, 5-Methyl-2-tliiouracil , 2-Thiouracil , 4~Thiouracil , 

10 5-Methyluracil, Uracil-5-oxyessigsauremethylester , Uracil-5- 
oxyessigsaure (v) , 5-Methyl-2-thiouracil , 3- (3-Amino-3-N-2- 
carboxypropyl)uracil, (acp3)w und 2 , 6-Diaminopurin. Die Anti- 
sense-Nukleinsaure kann alternativ biologisch unter Verwendung 
eines Express ionsvektors hergestellt warden, in den eine Nuklein- 

15 saure in Antisense-Richtung subkloniert worden ist (d.h. RNA, 
die von der eingebrachten Nukleinsaure transkribiert wird, ist 
zu einer Zielnukleinsaure von Interesse in Antisense-Richtung 
orientiert, was iiti nachstehenden Unterabsclinitt weiter 
beschrieben ist) . 

20 Die erf indungsgemaSen Antisense-Nukleins^ureniolekule werden 

liblicherweise an eine Zelle verabreicht oder in situ erzeugt, so 
dass sie mit der zellularen itiRISIA und/oder der genomischen DNA, 
die eine Desaturase kodiert, hybridisieren oder daran binden, 
urn dadurch die Expression des Proteins, z.B. durch Hemmung der 

25 Transkription und/oder Translation, zu hemmen. Die Hybridisierung 
kann durch herkominliche Nukleotidkomplementaritat unter Bildung 
eines stabilen Duplexes oder z.B. im Fall eines Antisense- 
Nukleinsauremolekuls , das DNA-Duplices bindet, durch spezifische 
Wechselwirkungen in der groiSen Furche der Doppelhelix erfolgen. 

30 Das Antisense-Molekul kann so modifiziert sein, dass es spezi- 
fisch an einen Rezeptor oder an ein auf einer ausgewahlten Zell- 
oberflache exprimiertes Antigen bindet, z.B. durch Binden des 
Antisense-Nukleinsauremolekuls an ein Peptid oder einen Anti- 
korper, das /der an einen Zelloberf lachenrezeptor oder ein Antigen 

35 bindet. Das Antisense-Nukleinsauremolekul kann auch unter Ver- 
wendung der hier beschriebenen Vektoren den Zellen zugefiihrt 
werden. Zur Erzielung ausreichender intrazellularer Konzentra- 
tionen der Antisense-Molektile sind Vektorkonstrukte, in denen 
sich das Antisense-Nukleinsauremolekul unter der Kontrolle eines 

40 starken prokaryotischen, viralen oder eukaryotischen, einschlieS- 
lich pf lanzlichen. Promoters befindet, bevorzugt. 

Bei einer weiteren Ausfuhrungsf 03rm ist das erf indungsgemSSe Anti- 
sense-Nukleinsauremolekul ein a-anomeres Nukleinsauremolekiil . Ein 
45 a-anomeres Nukleinsauremolekiil bildet spezifische doppelstrangige 
Hybride mit komplementarer RNA, wobei die Strange im Gegensatz zu 
gewohnlichen p-Einheiten parallel zueinander verlaufen. (Gaultier 
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et al. (1987) Nucleic Acids Res. 15:6625-6641). Das Antisense- 
Nukleinsauremolekiil kann zudem ein 2 ' -o-Methylribonukleotid 
(Inoue et al . (1987) Nucleic Acids Res. 15:6131-6148) oder 
ein chimares RNA-DNA-Analogon (Inoue et al. (1987) FEES Lett, 
5 215:327-330) ximfassen. 

Bei einer welter en Ausf iihrungsf orm ist eine erf indungsgemafie 
Antisense-Nukleinsaure ein Ribozym. Ribozyme sind katalytische 
RNA-Molekule mit Ribonukleaseaktivitat , die eine einzelstrangige 

10 Nukleinsaure, wie eine mRNA, spalten konnen, zu der sie einen 

komplementaren Bereich haben. Somit konnen Ribozyme (z.B. Hammer- 
head-Ribozyme (beschrieben in Haselhoff und Gerlach (198 8) Nature 
334:585-591)) zur katalytischen Spaltung von Desaturase-mRNA- 
Transkripten verwendet werden, urn dadurch. die Translation von 

15 Desaturase-mRNA zu hemmen. Ein Ribozym mit Spezifitat fur eine 
Desaturase-kodierende Nukleinsaure kann auf der Basis der Nukleo- 
tidsequenz einer der in SEQ ID NO : 1, 3, 5 oder 11 offenbarten 
Desaturase-cDNA (d.h. oder auf der Basis einer gemaiS den in 
dieser Erf indung gelehrten Verfahren zu isolierenden heterologen 

20 Sequenz gestaltet werden. Beispielsweise kann ein Derivat einer 
Tetrahymena-L-19-IVS-RNA konstruiert werden, wobei die Nukleotid- 
sequenz der aktiven Stelle komplementar zu der Nukleotidsequenz 
ist, die in einer Desaturase-kodierenden mRNA gespalten werden 
soil. Siehe z.B, Cech et al., US-Patent Nr. 4,987,071 und Cech 

25 et al . , US-Patent Nr. 5,116,742. Alternativ kaxm Desaturase-mRNA 
zur Selektion einer katalytischen RNA mit einer spezifischen 
Ribonukleaseaktivitat aus einem Pool von RNA-Molekulen verwendet 
werden. Siehe z.B. Bartel, D. , und Szostak, J.W. (1993) Science 
261:1411-1418. 

30 

Alternativ lasst sich die Desaturase-Gen-Expression henimen, 
indem Nukleotidsequenzen, die komplementar zixm regulatorischen 
Bereich einer Desaturase-Nukleotidsequenz (z.B. einem Desaturase- 
Promotor und/ oder -Enhancer) sind, so dirigiert werden, dass 
35 Dreif achhelix-Strukturen gebildet werden, welche die Transkrip- 
tion eines Desaturase-Gens in Zielzellen hemmen. Siehe allgemein 
Helene, C. (1991) Anticancer Drug Res. 6(6) 569-84; Helene, C, 
et al. (1992) Ann. N. Y. Acad. Sci . 660:27-36; und Maher. L.J. 
(1992) Bioassays 14 (12 ): 807-815 . 

40 

B. Genkonstrukt (= Nukleinsaurekonstrukt , -fragment oder 
Expressionskassette) 

Unter der erf indung sgemaSen Expressionskassette sind die in 
45 SEQ ID NO: 1, SEQ ID NO : 3, SEQ ID NO: 5 oder SEQ ID NO: 11 

genannten Sequenzen, die sich als Ergebnis des genetischen Codes 
und/oder deren funktionellen oder nicht f unktionellen Derivate 
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zu verstehen, die mit einem oder mehreren Regulationssignalen 
vorteilhaf teirweise zur Erhoiiung der Genexpression funktionell 
verkniipft warden und welche vorteilhaft die Expression der codie- 
renden Seqaienz in der Wirtszelle steuern. Diese regulatorischen 
5 Sequenzen sollen die gezielte Expression der Gene und der 

Proteinexpression ermoglichen. Dies kann beispielsweise je nach 
Wirtsorganismus bedeuten, dass das Gen erst nach Induktion 
exprimiert und/oder iiberexprimiert wird, oder dass es sofort 
exprimiert und/oder iiberexprimiert wird* Beispielsweise handelt 

10 es sich bei diesen regulatorischen Sequenzen um Sequenzen an 

die Induktoren oder Repressoren binden und so die Expression der 
Nukleinsaure regulieren. Zusatzlich zu diesen neuen Regulations- 
sequenzen oder anstelle dieser Sequenzen kann die natiirliche 
Regulation dieser Sequenzen vor den eigentlichen Strukturgenen 

15 noch vorhanden sein und gegebenenf alls genetisch verandert worden 
sein, so dass die natiirliche Regulation ausgeschaltet und die 
Expression der Gene erhoht wurde. Das Genkonstrukt kann aber 
auch einfacher aufgebaut sein, das heiSt es warden keine zusatz- 
lichen Regulationssignale vor die Nukleinsauresequenz oder 

20 dessen Derivate inseriert und der natiirliche Promoter mit seiner 
Regulation wurde nicht entfernt. Stattdessen wurde die natiirliche 
Regulationssequenz so mutiert, dass keine Regulation mehr erfolgt 
und/oder die Genexpression gesteigert wird. Diese veranderten 
Promotoren konnen in Form von Teilsequenzen (= Promoter mit 

25 Teilen der erf indungsgemafien Nukleinsauresequenz en) auch allein 
vor das natiirliche Gen zur Steigerung der Aktivitat gebracht 
werden. Das Genkonstrukt kann auSerdem vorteilhaf te3rweise auch 
eine oder mehrere sogenannte "enhancer Sequenzen" fianktionell 
verkniipft mit dem Promoter enthalten, die eine erhdhte Expression 

30 der Nukleinsauresequenz ermoglichen. Auch am 3'-Ende der DNA- 
Sequenzen konnen zusatzliche vorteilhafte Sequenzen inseriert 
werden wie weitere regulatorische Elemente oder Terminatoren , 
Die A-5-Desaturase-/A-6~Desaturase und/oder A~12-Desaturasegene 
konnen in einer oder mehreren Kopien in der Expressionskassette 

35 (= Genkonstrukt) enthalten sein, 

Die regulatorischen Sequenzen bzw. Faktoren konnen dabei wie 
oben beschrieben vorzugsweise die Genexpression der eingef iihrten 
Gene positiv beeinflussen und dadurch erhShen. So kann eine Ver- 
40 starkung der regulatorischen Elemente vorteilhaf terweise auf der 
Transkriptionsebene erfolgen, indem starke Transkriptionssignale 
wie Promotoren und/oder "Enhancer" verwendet werden. Daneben ist 
aber auch eine Verstarkung der Translation moglich, indem bei- 
spielsweise die Stabilitat der mRNA verbessert wird. 

45 
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Eine weitere Ausfiihrungsf oi^na der Erfindimg sind ein oder mehrere 
Genkonstrukte, die eine oder mehrere Sequenzen enthalten, die 
durch Seq ID NO: 1, 3, 5, 1 , 9 oder 11 definiert sind und gem. 
SEQ ID NO: 2, 4, 6, 8, 10 oder 12 Polypeptide kodieren. Dabei 
5 stammen SEQ ID NO: 1, 3, 5, 7 und 11 von Desaturasen wahrend 
SEQ ID NO: 9 fur eine Elongase codiert. Desaturasen codierende 
Enzyme, die eine Doppelbindung in A-5~, A~5- oder A-12~Position 
einfiihren, wobei das Substrat ein, zwei, drei oder vier Doppel- 
bindungen aufweisen. Die in SEQ ID NO: 9 dargestellte Sequenz 

10 codiert fiir eine Enzymaktivitat , die eine Fettsaure uiti min- 
destens zwei Kohlenstof f atome verlangert sowie ihre Homologen, 
Derivate oder Analoga, die f unktionsf ahig mit einem oder 
mehreren Regulationssignalen, vorteilhaf terweise zur Steigerung 
der Genexpression, verbunden sind. Beispiele fur diese Regula- 

15 t ions sequenzen sind Sequenzen, an die Induktoren oder Repressoren 
binden und so die Expression der Nukleinsaure regulieren. Zusatz- 
lich zu diesen neuen Regulationssequenzen kann die natiirliche 
Regulation dieser Sequenzen vor den eigentlichen Strukturgenen 
noch vorhanden sein und, wenn geeignet, genetisch modifiziert 

20 worden sein, so dass die naturliche Regulation ausgeschaltet 
worden ist und die Expression der Gene gesteigert worden ist. 
Das Genkonstrukt kann jedoch auch eine einfachere Struktur haben, 
d.h. dass keine zusatzlichen Regulationssignale vor der Sequenz 
SEQ ID NO: 1, 3, 5 oder 11 oder ihren Homologen inseriert worden 

25 sind und der naturliche Promotor mit seiner Regulation nicht 
deletiert worden ist . Statt dessen ist die naturliche Regula- 
tionssequenz so mutiert worden, dass keine Regulation mehr statt- 
findet und die Genexpression verstarkt ist. Das Genkonstrukt 
kann auSerdem vorteilhaf teirweise eine oder mehrere sogenannte 

30 Enhancer-Sequenzen, die f unktionsf ahig mit dem Promotor verbunden 
sind und die gesteigerte Expression der Nukleinsauresequenz 
ermoglichen, \ainfassen. Es ist auch moglich, am 3 ' -Ende der DNA- 
Sequenzen zusatzlich vorteilhafte Sequenzen zu inserieren, bei- 
spielsweise weitere Regulationselemente oder Terminator en , Die 

35 Desaturasegene und das Elongasegen konnen im Genkonstrukt in 
einer oder mehreren Kopien vorliegen. Sie konnen in einem 
Genkonstrukt oder mehreren Genkonstrukten vorliegen. Dieses 
Genkonstrukt oder die Genkonstrukte kSnnen zusammen im Wirts- 
organismus exprimiert werden. Dabei kann das Genkonstrukt oder 

40 die Genkonstrukte in einem oder mehreren Vektoren inseriert sein 
und frei in der Zelle vorliegen oder aber im Genom inseriert 
sein. Es ist vorteilhaf t f-Qr die Insertion weiterer Gene in 
Organismen, wenn weitere Gene im Genkonstrukt vorliegen. 

45 Vorteilhafte Regulationssequenzen ftir das neue Verfahren liegen 
beispielsweise in Promo toren vor, wie dem cos-, tac-, trp-, tet-, 
trp-tet-, Ipp-, lac-, Ipp-lac-, lacl^-' T7-, T5-, T3-, gal-, trc-. 
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ara-, SP6-, X-Pr- oder A.-PL-Proinotor und warden vorteilhaf terweise 
in Gram-negativen Bakterien angewendet . Weitere vorteilhaf te 
Regulationssequenzen liegen beispielsweise in den Gram-positiven 
Promotoren amy und SP02, in den Hefe- oder Pilzproitiotoren ADCl, 
5 MFa, AC, P-60, CYCl, GAPDH, TEF, rp28, ADH oder in den Pflanzen- 
promotoren CaMV/35S [Franck et al . , Cell 21 (1980) 285-294], 
PRPl [Ward et al . , Plant. Mol . Biol. 22 (1993)], SSU, OCS, lib4, 
usp, STLSl, B33, nos oder im Ubiquitin- oder Phaseolin-Promotor 
vor- In diesem Zusainmenhang vorteilhaf t sind ebenfalls induzier- 

10 bare Promotoren, wie die in EP-A-0 388 186 (Benzylsulf onamid- 
induzierbar) , Plant J. 2, 1992:397-404 (Gatz et al . , Tetra- 
cyclin-induzierbar ) , EP-A-0 335 528 (Abzisinsaure-induzierbar ) 
Oder WO 93/21334 (Ethanol- oder Cyclohexenol-induzierbar ) be- 
schriebenen Promotoren. Weitere geeignete Pf lanzenpromotoren sind 

15 der Promotor von cytosolischer FBPase oder der ST-LSI-Promotor 
der Kartoffel (Stockhaus et al., EMBO J. 8, 1989, 2445), der 
Phosphoribosylpyrophosphatamidotransf erase-Promotor aus Glycine 
max (Genbank-Zugangsnr. U87999) oder der in EP-A-0 249 676 
beschriebene nodienspezif ische Promotor. Besonders vorteilhaf te 

20 Promotoren sind Promotoren, welche die Expression in Geweben 

ermoglichen, die an der Fettsaurebiosynthese beteiligt sind. Ganz 
besonders vorteilhaft sind samenspez if ische Promotoren, wie der 
ausfiihrungsgemaSe USP Promotor aber auch andere Promotoren wie 
der LeB4- (Baeixmlein et al.. Plant J., 1992, 2 (2) (2 ): 233-239 ) , 

25 DC3 (Thomas, Plant Cell 1996, 263:359-368), Phaseolin- oder 
Napin-Promotor . Weitere besonders vorteilhaf te Promotoren 
sind samenspezif ische Promotoren, die fiir monokotyle oder 
dikotyle Pflanzen verwendet werden konnen und in US 5,608, 152 
(Napin-Promotor aus Raps) , WO 98/45461 (Oleosin- Promotor aus 

30 Arobidopsis) , US 5,504,200 (Phaseolin-Promotor aus Phaseolus 
vulgaris) , WO 91/13980 (Bce4-Promotor aus Brassica) , von 
Baeumlein et al . , Plant J., 1992, 2 (2):233-239 (LeB4- 
Promotor aus einer Leguminose) beschrieben sind, wobei sich 
diese Promotoren fiir Dikotyledonen eignen. Die folgenden 

35 Promotoren eignen sich beispielsweise fiir Monokotyledonen lpt-2- 
oder Ipt-l-Promotor aus Gerste (WO 95/15389 und WO 95/23230), 
Hordein-Promotor aus Gerste und andere, in WO 99/16890 
beschriebene geeignete Promotoren. 

40 Es ist im Prinzip moglich, alle natiirlichen Promotoren mit ihren 
Regulationssequenzen, wie die oben genannten, fiir das neue Ver- 
fahren zu verwenden. Es ist ebenfalls moglich und vorteilhaft, 
zusatzlich synthetische Promotoren zu verwenden. 

45 Das Genkonstrukt kann, wie oben beschrieben, auch weitere Gene 

umfassen, die in die Organismen eingebracht werden sollen. Es ist 
moglich und vorteilhaft, in die Wirtsorganismen Regulationsgene, 
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wie Gene fur Induktoren, Repressoren oder Enzyme, welche durch 
ihre Enzymaktivitat in die Regulation eines oder mehrerer Gene 
eines Biosynthesewegs eingreifen, einzubringen und darin zu 
exprimieren. Diese Gene konnen heterologen oder homologen 
5 Ursprungs sein. Weiterhin koimen vorteilhaft im Nukleinsaurekon- 
strukt bzw. Genkonstrukt weitere Biosynthesegene des Fettsaure- 
oder Lipidstof fwechsels enthalten sein oder aber diese Gene 
konnen auf einem weiteren oder mehreren weiteren Nukleinsaure- 
konstrukten liegen. Vorteilhaft werden als Biosynthesegene des 

10 Fettsaure- oder Lipidstof fwechsels ein Gen ausgewahlt aus der 
Gruppe Acyl-CoA-Dehydrogenase (n) , Acyl~ACP[= acyl carrier 
protein] -Desaturase (n) , Acyl-ACP-Thioesterase (n) , Fettsaure-Acyl- 
Transf erase (n) , Fettsaure-Synthase (n) , Fettsaure-Hydroxylase (n) , 
Acetyl-Coenzym A-Carboxylase (n) , Acyl-Coenzym, A-Oxidase (n) , 

15 Fettsaure-Desaturase (n) , Fettsaure-Acetylenasen, Lipoxygenasen, 
Triacylglycerol-Lipasen, Allenoxid-Synthasen, Hydroperoxid-Lyasen 
Oder Fettsaure-Elongase (n) oder deren Kombinationen veirwendet. 

Genkonstrukte lamfassen vorteilhaf terweise zur Expression der 
20 anderen vorliegenden Gene weitere 3'- und/oder 5'-terminale 
Regulationssequenzen zur Steigerung der Expression^ die in 
Abh^ngigkeit vom gewahlten Wirtsorganismus und dem Gen oder 
den Genen fiir die optimale Expression ausgewahlt werden. 
Diese Regulationssequenzen sollen, wie oben erwahnt, die 
25 spezifische Expression der Gene und die Proteinexpression 

ermoglichen. Dies kann je nach dem Wirtsorganismus beispiels- 
weise bedeuten, dass das Gen nur nach Induktion exprimiert oder 
tiberexprimiert wird oder dass es sofort exprimiert und/oder 
tiberexprimiert wird, 

30 

Die Regulationssequenzen oder -faktoren konnen auSerdem vorzugs- 
weise eine vorteilhafte Wirkung auf die Expression der ein- 
gebrachten Gene haben und diese somit steigern. Auf diese Weise 
ist es moglich, dass die Regulationselemente unter Verwendung 
35 starker Transkriptionssignale, wie Promotoren und/oder Enhancer, 
vorteilhaf terweise auf Transkriptionsebene verstarkt werden. Es 
ist jedoch weiterhin auch moglich, die Translation zum Beispiel 
durch Verbesserung der mRNA-Stabilitat zu verstarken. 

40 C. Rekombinante Expressionsvektoren und Wirtszellen 

Ein weiterer Aspekt der Erfindung betrifft Vektoren, vorzugs- 
weise Expressionsvektoren, die eine Nukleinsaure enthalten, 
die eine Desaturase allein (oder einen Teil davon) oder ein 
45 unter Punkt b beschriebenes Nukleinsaurekonstrukt in dem die 
erf indungsgemaiSe Nukleinsaure allein oder in Kombination mit 
weiteren Biosynthesegenen des Fettsaure- oder Lipidstof fwechsels 
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wie Desaturasen oder Elongasen enthalten ist. Wie hier verwendet, 
betrifft der Begriff "Vektor" ein Nukleinsauremolektil, das eine 
andere Nukleinsaure transport ieren kann, an welche es gebunden 
ist. Ein Vektortyp ist ein "Plasmid", was ftir eine zirkulare 
5 doppelstrangige DNA-Sclileif e steht, in die zusatzlichen DNA- 
Segmente ligiert werden konnen. Ein weiterer Vektortyp ist 
ein viraler Vektor, wobei zusatzliche DNA-Segmente in das 
virale Genom ligiert werden konnen. Bestimmte Vektoren konnen 
in einer Wirtszelle, in die sie eingebracht worden sind, 

10 autonom replizieren (z.B. Bakterienvektoren mit bakteriellem 
Replikationsursprung und episomale Saugervektoren) . Andere 
Vektoren (z.B. nicht-episomale Saugervektoren) werden beim 
Einbringen in die Wirtszelle in das Genom einer Wirtszelle 
integriert und dadurch zusammen mit dem Wirtsgenom repliziert. 

15 Zudem konnen bestiirante Vektoren die Expression von Genen, mit 
denen sie funktionsf ahig verbiinden sind, steuern. Diese Vektoren 
werden hier als "Expressionsvektoren" bezeichnet. Gewohnlich 
haben Expressionsvektoren, die fur DNA-Rekombinationstechniken 
geeignet sind, die Form von Plasmiden. In der vorliegenden 

20 Beschreibung konnen "Plasmid" und "Vektor" austauschbar ver- 
wendet werden, da das Plasmid die am haufigsten verwendete 
Vektorform ist. Die Erfind"ung soli jedoch diese anderen 
Expressionsvektorf ormen, wie virale Vektoren (z.B. replikations- 
defiziente Retroviren, Adenoviren und adenoverwandte Viren) , 

25 die ahnliche Funktionen ausuben, umfassen. Ferner soil der 

Begriff Vektor auch andere Vektoren, die dem Fachmann bekannt 
sind, wie Phagen, Viren, wie SV40, CMV, Baculovirus, Adenovirus, 
Transposons, IS-Elemente, Phasmide, Phagemide, Cosmide, lineare 
Oder zirkulare DNA, tomfassen. 

30 

Die erf indungsgemafien rekombinanten Expressionsvektoren umfassen 
eine erf indungsgemaSe Nukleinsaure oder ein erf indungsgemaiSes 
Genkonstrukt in einer Form, die sich zur Expression der Nuklein- 
saure in einer Wirtszelle eignet, was bedeutet, dass die re- 

35 kombinanten Expressionsvektoren eine oder mehrere Regulations- 
sequenzen, ausgewahlt auf der Basis der zur Expression zu ver- 
wendenden Wirtszellen, die mit der zu exprimierenden Nuklein- 
sauresequenz funktionsf ahig verbunden ist, umfasst. In einem 
rekombinanten Expressionsvektor bedeutet "funktionsf ahig ver- 

40 bunden" , dass die Nukleotidsequenz von Interesse derart an 
die Regulationssequenz (en) gebunden ist, dass die Expression 
der Nukleotidsequenz moglich ist und sie aneinander gebunden 
sind, so dass beide Sequenzen die vorhergesagte, der Sequenz 
zugeschriebene Funktion erfiillen (z.B.- in einem In-vitro- 

45 Transkriptions-ZTranslationssystem oder in einer Wirtszelle, 
wenn der Vektor in die Wirtszelle eingebracht wird) , Der 
Begriff "Regulationssequenz" soil Promotoren, Enhancer und 
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andere Expressionskontrollelemente (z.B. Polyadenylierungs- 
signale) umfassen. Diese Regulationssequenzen sind z.B. 
beschrieben in Goeddel: Gene Expression Technology: Methods 
in Enzymology 185, Academic Press, San Diego, CA (1990), oder 
5 siehe: Gruber und Crosby, in: Methods in Plant Molecular Biology 
and Biotechnolgy, CRC Press, Boca Raton, Florida, Hrsgb. : Glick 
Tind Thompson, Kapitel 7, 89-108, einschlieiSlich der Literatur- 
stellen darin. Regulationssequenzen umfassen solche, welche die 
konstitutive Expression einer Nukleotidsequenz in vielen Wirts- 

10 zelltypen steuern, und solche, welche die direkte Expression der 
Nukleotidsequenz nur in bestimmten Wirtszellen unter bestimmten 
Bedingungen steuern. Der Fachmann weiS, dass die Gestaltung 
des Expressionsvektors von Faktoren, wie der Auswahl der zu 
trans formierenden Wirtszelle, dem AusmaE der Expression des 

15 gewiinschten Proteins usw. , abhangen kann. Die erf indungsgemaSen 
Expressionsvektoren konnen in Wirtszellen eingebracht werden, um 
dadurch Proteine oder Peptide, einschlieE.lich Fusionsproteinen 
Oder -peptiden, herzustellen, die von den Nukleinsauren, wie hier 
beschrieben, kodiert werden (z.B. Desaturasen, mutant e Formen von 

20 Desaturasen, Fusionsproteine usw. ) . 

Die erf indungsgemaSen rekombinanten Expressionsvektoren konnen 
zur Expression von Desaturasen und Elongasen in prokaryotischen 
oder eukaryotischen Zellen gestaltet sein. Beispielsweise kSnnen 

25 Desaturasegene in bakteriellen Zellen, wie C. glutamicum, 

Insektenzellen (unter Veirwendung von Baculovirus -Express ions - 
vektoren) , Hefe- und anderen Pilzzellen (siehe Romanes, M.A. , 
et al. (1992) "Foreign gene expression in yeast: a review", 
Yeast 8:423-488; van den Hondel, C. A. M.J. J., et al . (1991) 

30 "Heterologous gene expression in filamentous fungi", in: More 
Gene Manipulations in Fungi, J.W. Bennet & L.L. Lasure, Hrsgb., 
S. 396-428: Academic Press: San Diego; und van den Hondel, 
C.A.M-J.J., Sc P\int, P.J. (1991) "Gene transfer systems and vector 
development for filamentous fungi, in: Applied Molecular Genetics 

35 of Fungi, Peberdy, J.F., et al . , Hrsgb., S. 1-28, Cambridge 
University Press: Cambridge), Algen (Falciatore et al . , 1999, 
Marine Biotechnology . 1, 3:239-251), Ciliaten der Typen: Holo- 
trichia, Peritrichia, Spirotrichia, Suctoria, Tetrahymena, Para- 
mecium, Colpidium, Glaucoma, Platyophrya, Potomacus, Desaturase- 

40 udocohnilembus , Euplotes, Engelmaniella und Stylonychia, ins- 

besondere der Gattung Stylonychia lemnae, mit Vektoren nach einem 
Trans fonaationsverfahr en, wie beschrieben in WO 98/01572, sowie 
Zellen vielzelliger Pflanzen (siehe Schmidt, R. und Willmitzer, 
L, (1988) "High efficiency Agrojbacteriiun tumefaci ens-mediated 

45 transformation of AjraJbidopsis thaliana leaf and cotyledon 

explants" Plant Cell Rep. : 583-586; Plant Molecular Biology and 
Biotechnology, C Press, Boca Raton, Florida, Kapitel 6/7, 
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S. 71-119 (1993); F.F. White, B. Jenes et al . , Techniques for 
Gene Transfer, in: Transgenic Plants, Bd. 1, Engineering and 
Utilization, Hrsgb. : Kung xind R. Wu, Academic Press (1993), 
128-43; Potrykus, Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 
5 (1991), 205-225 (und darin zitierte Literaturstellen) ) oder 
Saugerzellen exprimiert werden. Geeignete Wirtszellen werden 
ferner erortert in Goeddel, Gene Expression Technology: Methods 
in Enzymology 185, Academic Press, San Diego, CA (1990). Der 
rekombinante Expressionsvektor kann alternativ, zxm Beispiel 
10 unter Verwendung von T7-Promotor-Regulationssequenzen und 

T7-Polymerase, in vitro transkribiert und translatiert werden. 

Die Expression von Proteinen in Prokaryoten erfolgt meist mit 
Vektoren, die konstitutive oder induzierbare Promotoren ent- 

15 halten, welche die Expression von Fusions- oder nicht-Fusions- 
proteinen steuern. Fusions vektoren fiigen eine Reihe von Amino- 
sauren an ein darin kodiertes Protein an, gewohnlich am Amino- 
terminus des rekombinanten Proteins, aber auch am C-Terminus 
oder fusioniert innerhalb geeigneter Bereiche in den Proteinen. 

20 Diese Fusionsvektoren haben gewohnlich drei Aufgaben: 1) die 
Verstarkung der Expression von rekombinantem Protein; 2) die 
Erhohung der Loslichkeit des rekombinanten Proteins und 3) die 
Untersttitzung der Reinigung des rekombinanten Proteins durch 
Wirkung als Ligand bei der Af f initatsreinigung . Bei Fusions- 

25 Express ionsvektoren wird oft eine proteolytische Spaltstelle an 
der Verbindungss telle der Fusionseinheit und des rekombinanten 
Proteins eingebracht, so dass die Abtrennung des rekombinanten 
Proteins von der Fusionseinheit nach der Reinigung des Fusions- 
proteins m5glich ist. Diese Enzyme und ihre entsprechenden 

30 Erkennungssequenzen umfassen Faktor Xa, Thrombin und Entero- 
kinase . 

Typische Fusions-Expressionsvektoren sind u.a. pGEX (Phairmacia 
Biotech Inc; Smith, D.B., und Johnson, K.S. (1988) Gene 

35 67:31-40), pMAL (New England Biolabs, Beverly, MA) und pRITS 

(Pharmacia, Piscataway, NJ) , bei denen Glutathion-S-Transf erase 
(GST) , Maltose E-bindendes Protein bzw. Protein A an das 
rekombinante Zielprotein fusioniert wird. Bei einer Ausfuhrungs- 
form ist die Desaturase-kodierende Sequenz in einen pGEX- 

40 Expressionsvektor kloniert, so dass ein Vektor erzeugt wird, 

der ein Fusionsprotein kodiert, das vom N-Terminus zvm C-Terminus 
GST-Thrombin-Spaltstelle-X-Protein umfasst. Das Fusionsprotein 
kann durch Af f initatschromatographie unter Verwendung von Gluta- 
thion-Agarose-Harz gereinigt werden. Rekombinante Desaturase, die 

45 nicht an GST fusioniert ist, kann durch Spaltung des Fusions- 
proteins mit Thrombin- gewonnen werden. 
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Beispiele fur geeignete induzierbare nicht-Fusions-E, coli- 
Expressionsvektoren sind u.a. pTrc (Amann et al . (1988) Gene 
69:301-315) und pET lid (Studier et al . , Gene Expression 
Technology: Methods in Enzymology 185, Academic Press, San Diego, 
5 Kalifornien (1990) 60-89) . Die Zielgenexpression vom pTrc-Vektor 
beruht auf der Transkription durch Wirts-RNA-Polymerase von einem 
Hybrid-trp-lac-Fusionspromotor . Die Zielgenexpression aus dem pET 
lld-Vektor beruht auf der Transkription von einem T7-gnl0-lac- 
Fusions-Promotor , die von einer coexprimierten viralen RNA-Poly- 
10 merase (T7 gnl) vermittelt wird. Diese virale Polymerase wird 
von den Wirtsstammen BL21 (DE3) oder HMS174 (DE3) von einem 
residenten X-Prophagen bereitgestellt , der ein T7 gnl-Gen unter 
der Transkriptionskontrolle des lacUV 5-Promotors birgt . 

15 Andere in prokaryotischen Organismen geeignete Vektoren sind dem 
Fachmann bekannt, diese Vektoren sind beispielsweise in E. coli 
pLG338, PACYC184, die pBR-Reihe, wie pBR322, die pUC-Reihe, wie 
pUCl8 Oder pUCl9, die Mll3mp-Reihe , pKC3 0, pRep4, pHSl, pHS2 , 
pPLc236, pMBL24, pLG2Q0, pUR290, pIN-IIll^^-Bl , X,gtll or pBdCI , 

20 in Streptomyces pIJlOl, pIJ364, pIJ702 oder pIJ361, in Bacillus 
pUBllO, pC194 Oder pBD214, in Corynebacterium pSA77 oder pAJ667. 
Eine Strategie zur Maximierung der Expression von rekombinantem 
Protein ist die Expression des Proteins in einem Wirtsbakteriiam, 
dessen Fahigkeit zur proteolytischen Spaltung des rekombinanten 

25 Proteins gestort ist (Gottesman, S., Gene Expression Technology: 
Methods in Enzymology 185, Academic Press, San Diego, Kalifornien 
(199 0) 119-12 8) . Eine weitere Strategie ist die Veranderxing der 
Nukleinsauresequenz der in einen Expressionsvektor zu inserieren- 
den Nukleinsaure, so dass die einzelnen Codons fur jede Amino- 

30 saure diejenigen sind, die vorzugsweise in einem zur Expression 
ausgewahlten Bakteriiim, wie C. g-lutamicum, verwendet werden 
(Wada et al . (1992) Nucleic Acids Res. 20:2111-2118). Diese 
Veranderung der erf indungsgemaSen Nukleinsauresequenzen erfolgt 
durch Standard-DNA-Synthesetechniken . 

35 

Bei einer weiteren Aus fiihrungs form ist der Desaturase- 
Expressionsvektor ein Hef e-Expressionsvektor , Beispiele fiir 
Vektoren zur Expression in der Hefe S. cerevisiae umfassen 
pYeDesaturasecl (Baldari et al. (1987) Embo J. 6:229-234), 

40 pMFa (Kurjan und Herskowitz (1982) Cell 30:933-943), pJRY88 

(Schultz et al. (1987) Gene 54:113-123) sowie pYES2 (Invitrogen 
Corporation, San Diego, CA) . Vektoren und Verfahren zur Kon- 
struktion von Vektoren, die sich zur Verwendung in anderen 
Pilzen, wie den filamentosen Pilzen, eignen, umfassen diejenigen, 

45 die eingehend beschrieben sind in: van den Hondel, C. A. M.J. J., & 
Punt, P.J. (1991) "Gene transfer systems and vector development 
for filamentous fungi, in: Applied Molecular Genetics of fungi. 
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J.F. Peberdy et al., Hrsgb., S. 1-28, Cambridge University Press: 
Cambridge, oder in: More Gene Manipulations in Fungi [J.W. Bennet 
& L.L. Lasure, Hrsgb., S. 396-428: Academic Press: San Diego]. 
Weitere geeignete Hefevektoren sind beispielsweise pAG-1, YEp6, 
5 YEpl3 Oder pEMBLYe23 . 

Alternativ konnen die erf indungsgemaSen Desaturasen in Insekten- 
zellen unter Verwendung von Baculovirus-Expressionsvektoren 
exprimiert werden, Baculovirus-Vektoren, die zur Expression von 
10 Proteinen in geziichteten Insektenzellen (z.B. Sf9-Zellen) ver- 
fugbar sind, \amfassen die pAc-Reihe (Smith et al . (1983) Mol . 
Cell Biol.. 3:2156-2165) und die pVL-Reihe (Lucklow und Summers 
(1989) Virology 170:31-39). 

15 Die oben genannten Vektoren bieten nur einen kleinen Uberblick 
iiber mc5gliche geeignete Vektoren. Weitere Plasmide sind dem 
Fachmann bekannt und sind zum Beispiel beschrieben in: Cloning 
Vectors (Hrsgb. Pouwels, P.H., et al . , Elsevier, Amsterdam- 
New York-Oxford, 1985, ISBN 0 444 904018). 

20 

Bei noch einer weiteren Ausf uhrungsf orm wird eine erfindungs- 
gemaj^e Nukleinsaure in Saugerzellen unter Verwendung eines 
Sauger-Expressionsvektors exprimiert. Unter Saugern werden 
im Sinne der Erfindung alle nicht-humanen Sauger verstanden. 

25 Beispiele fiir Sauger-Expressionsvektoren umfassen pCDM8 (Seed, 
B. (1987) Nature 329:840) und pMT2PC (Kaufman et al . (1987) 
EMBO J. 6:187-195) . Bei der Verwendung in Saugerzellen werden 
die Kontrollfunktionen des Express ionsvektors oft von viralen 
Regulationselementen bereitgestellt . Ublicherweise verwendete 

30 Promotoren stammen z.B. aus Polyoma, Adenovirus2, Cytomegalie- 
virus und Simian Virus 40. Weitere geeignete Expressionssysteme 
fiir prokaryotische und eukaryotische Zellen siehe in den Kapiteln 
16 und 17 von Sambrook, J., Fritsch, E.F., und Maniatis, T, , 
Molecular Cloning: A Laboratory Manual, 2. Auflage, Cold Spring 

35 Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold 
Spring Harbor, NY, 1989. 

Bei einer anderen Ausfiihrungsf orm kann der rekombinante Sauger- 
Expressionsvektor die Expression der Nukleinsaure vorzugsweise in 

40 einem bestimmten Zelltyp steuern (z.B. werden gewebespezif ische 
Regulationselemente zur Expression der Nukleinsaure verwendet) . 
Gewebespezif ische Regulationselemente sind im Fachgebiet bekannt. 
Nicht beschrankende Beispiele ftir geeignete gewebespezif ische 
Promotoren sind u.a. der Alb-uminpromotor (leberspezif isch; 

45 Pinkert et al . (1987) Genes Dev. 1:268-277), lymphoidspezif ische 
Promotoren (Calame und Eaton (1988) . Adv. Immunol. 43:235-275), 
insbesondere Promotoren von T-Zellrezeptoren (Winoto und 
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Baltimore (1989) EMBO J. 8:729-733) iind Iiraniinglobulinen (Banerji 
et al. (1983) Cell 33:729-740; Queen und Baltimore (1983) Cell 
33:741-748), neuronspezif ische Promotoren (z.B, Neurof ilament- 
Promotor; Byrne und Ruddle (1989) PNAS 86:5473-5477), pankreas- 
5 spezifische Promotoren (Edlund et al . , (1985) Science 

230:912-916) wad milchdriisenspezif ische Promotoren (z.B. Milch- 
serum-Promotor ; US-Patent Nr. 4,873,316 und Europaische Patent- 
anmeldung-Verof f entlichung Nr. 264,166). Auch entwicklungs- 
regulierte Promotoren sind umfasst, z.B. die hox-Promotoren 
10 der Maus (Kessel und Gruss (1990) Science 249:374-379) und 

der Fetoprotein- Promotor (Campes und Tilghman (1989) Genes Dev. 
3:537-546) . 

Bei einer weiteren Ausfiihrungsf orm konnen die erf indungsgemaEen 
15 Desaturasen in einzelligen Pf lanzenzellen (wie Algen) , siehe 
Falciatore et al., 1999, Marine Biotechnology 1 (3):239-251 
und darin zitierte Literaturangaben, und Pf lanzenzellen aus 
hoheren Pflanzen (z.B. Spermatophyten, wie Feldf riichten) 
exprimiert werden. Beispiele fur Pf lanzen-Expressionsvektoren 
20 umfassen solche, die eingehend beschrieben sind in: Becker, D., 
Kemper, E, , Schell, J., und Masterson, R. (1992) "New plant 
binary vectors with selectable markers located proximal to the 
left border". Plant Mol . Biol. 20:1195-1197; und Bevan, M.W. 
(1984) "Binary Agrobacterium vectors for plant transformation", 
25 Nucl. Acids Res. 12:8711-8721; Vectors for Gene Transfer in 
Higher Plants; in: Transgenic Plants, Bd. 1, Engineering and 
Utilization, Hrsgb.: Kung und R. Wu, Academic Press, 1993, 
S. 15-38. 

30 Eine Pf lanzen-Expressionskassette enthalt vorzugsweise 

Regulationssequenzen, welche die Genexpression in Pflanzen- 
zellen steuern konnen und f unktionsf ahig verbunden sind, so dass 
jede Sequenz ihre Funktion, wie Termination der Transkription, 
erfullen kann, beispielsweise Polyadenylierungssignale. Bevor- 

35 zugte Polyadenylierungssignale sind diejenigen, die aus Agro- 
bacterium tumef aciens-t-DNA stammen, wie das als Octopinsynthase 
bekannte Gen 3 des Ti-Plasmids pTiACH5 (Gielen et al . , EMBO 
J. 3 (1984) 835ff.) oder funktionelle Aquivalente davon, aber 
auch alle anderen in Pflanzen funktionell aktiven Terminatoren 

40 sind geeignet . 

Da die Pf lanzengenexpression sehr oft nicht auf Transkriptions- 
ebenen beschrankt ist, enthalt eine Pf lanzen-Expressionskassette 
vorzugsweise andere funktionsf ahig verbunden Sequenzen, wie 
45 Translations enhancer, beispielsweise die Overdrive-Sequenz , 
welche die 5 ' -untranslatierte Leader-Sequenz aus Tabakmosaik- 
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virus, die das Protein/RNA-Verhaltnis erhoht, enthalt (Gallie 
et al., 1987, Nucl. Acids Research 15:8693-8711). 

Die Pf lanzengenexpression muss funktionsf ahig itiit einem 
5 geeigneten Promoter verbunden sein, der die Genexpression auf 

rechtzeitige, zell- oder gewebespezif ische Weise durchf lihrt . 
Bevorzugt sind Promotoren, welche die konstitutive Expression 
herbeifuhren (Benfey et al . , EMBO J. 8 (1989) 2195-2202), wie 
diejenigen, die von Pf lanzenviren stammen, wie 35S CAMV (Franck 
10 et al., Cell 21 (1980) 285-294), 19S CaMV (siehe auch US 5352605 
und WO 84/02913) oder Pf lanzenpromotoren, wie der in US 4,962,028 
beschriebene der kleinen Untereinheit der Rubisco. 

Andere bevorzugte Sequenzen fiir die Verwendung zur funktions- 
15 fahigen Verbindung in Pf lanzengenexpressions-Kassetten sind 

Targeting-Sequenzen, die zur Steuerung des Genproduktes in sein 
entsprechendes Zellkompartiment notwendig sind (siehe eine Uber- 
sicht in Kermode, Grit. Rev. Plant Sci . 15, 4 (1996) 285-423 
und darin zitierte Literaturstellen) , beispielsweise in die 
20 Vakuole, den Zellkern, alle Arten von Plastiden, wie Amylo- 

plasten, Chloroplasten, Chromoplasten, den extrazellularen Raum, 
die Mitochondrien, das Endoplasmat ische Retikulinn, Olkorper, 
Peroxisomen und andere Kompartimente von Pf lanzenzellen. 

25 Die Pf lanzengenexpression lasst sich auch uber einen chemisch 

induzierbaren Promoter erleichtern (siehe eine Ubersicht in Gatz 
1997, Annu. Rev. Plant Physiol. Plant Mol . Biol., 48:89-108). 
Chemisch induzierbare Promotoren eignen sich besonders, wenn 
gewiinscht wird, dass die Genexpression auf zeitspezif ische Weise 

30 erfolgt. Beispiele fiir solche Promotoren sind ein Salicylsaure- 
induzierbarer Promoter (WO 95/19443), ein Tetracyclin-induzier- 
barer Promoter (Gatz et al . (1992) Plant J. 2, 397-404) vnd ein 
Ethanol-induzierbarer Promoter. 

35 Auch Promotoren, die auf biotische oder abiotische Stress- 

bedingungen reagieren, sind geeignete Promotoren, beispielsweise 
der pathogeninduzierte PRPl-Gen-Promotor (Ward et al - , Plant . 
Mel. Biol. 22 (1993) 361-366), der hitzeinduzierbare hsp80- 
Promotor aus Tomate (US 5,187,267), der kalteinduzierbare Alpha- 

40 amylase-Promotor aus Kartoffel (WO 96/12814) oder der durch 
Wunden induzierbare pinll-Promotor (EP-A-0 375 091) . 

Es sind insbesondere solche Promotoren bevorzugt, welche die 
Genexpression in Geweben und Organen herbeifiihren, in denen 
45 die Lipid- und Olbiosynthese stattfindet, in Samenzellen, wie 
den Zellen des Endosperms und des sich entwickelnden Embiryos . 
Geeignete Promotoren sind der Napingen-Promotor aus Raps 
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(US 5,608,152), der USP-Promotor aus Vicia faba (Baeumlein 
et al., Mol Gen Genet, 1991, 225 (3):459-67), der Oleosin- 
Promotor aus Arabidopsis (WO 98/45461) , der Phaseolin-Promotor 
aus Phaseolus vulgaris (US 5,504,200), der Bce4-Promotor aus 
5 Brassica (WO 91/13980) oder der Legumin-B4-Proiaotor (LeB4; 
Baeumlein et al., 1992, Plant Journal, 2 (2):233"9) sowie 
Promotoren, welche die samenspezif ische Expression in Mono- 
kotyledonen-Pf lanzen, wie Mais, Gerste, Weizen, Roggen, Reis usw. 
herbeiftihren. Geeignete beachtenswerte Promotoren sind der lpt2- 

10 Oder Iptl-Gen-Promotor aus Gerste (WO 95/15389 und WO 95/23230) 
Oder die in WO 99/16890 beschriebenen (Promotoren aus dem 
Gersten-Hordein-Gen, dem Reis-Glutelin-Gen, dem Reis-Oryzin-Gen, 
dem Reis-Prolamin-Gen, dem Weizen-Gliadin-Gen, Weizen-Glutelin- 
Gen, dem Mais-Zein-Gen, dem Haf er-Glutelin-Gen, dem Sorghum- 

15 Kasirin-Gen, dem Roggen-Secalin-Gen) . 

Insbesondere kann die multiparallele Expression von erfindungs- 
gemaSen Desaturasen allein oder in Kombination mit anderen 
desaturasen oder Elongasen gewunscht sein. Die Einfiihrung solcher 

20 Expressionskassetten kann uber eine simultane Transformation 
mehrerer einzelner Expressionskonstrukte erfolgen oder durch 
Kombination mehrerer Expressionskassetten auf einem Konstrukt, 
Auch konnen mehrere Vektoren mit mit jeweils mehreren 
Exopressionskassetten transf ormiert und auf die Wirtszelle 

25 lifoertragen werden. 

Ebenfalls besonders geeignet sind Promotoren, welche die 
plastidenspezif ische Expression herbeiftihren, da Plastiden 
das Kompartiment sind, in dem die Vorlaufer sowie einige End- 
30 produkte der Lipidbiosynthese synthetisiert werden. Geeignete 
Promotoren, wie der virale RNA-Polymerase-Promotor , sind 
beschrieben in WO 95/16783 und WO 97/06250, und der clpP- 
Promotor aus Arabidopsis, beschrieben in WO 99/46394. 

35 Die Erfindung stellt zudem einen rekombinanten Expressions- 
vektor bereit, umfassend ein erf indungsgemaJSes DNA Molekul, 
das in Antisense-Richtung in den Expressionsvektor kloniert 
ist, d.h. das DNA-Molekai ist derart mit einer regulatorischen 
Seqiienz funktionsf ahig verbunden, dass die Expression (durch 

40 Transkription des DNA-Molekiils) eines RMA-Molekiils , das zur 
Desaturase-mRNA "Antisense"' ist, ermoglicht wird. Es konnen 
Regulationssequenzen ausgewahlt werden, die funktionsf ahig mit 
einer in Antisense-Richtung klonierten Nukleinsaure verbimden 
sind und die kontinuierliche Expression des Antisense-RNA-Mole- 

45 kuls in einer Vielzahl von Zelltypen steuern, zum Beispiel konnen 
virale Promotoren und/ oder Enhancer oder Regulationssequenzen 
ausgewahlt werden, welche die konstitutive, gewebespezif ische 
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Oder zelltypspezif ische Expression von Antisense-RNA steuern. 

Der Antisense-Expressionsvektor kann in Form eines rekombinanten 
Plasmids, Phagemids oder attenuierten Virus vorliegen, in dem 
Antisense-Nukleinsauren unter der Kontrolle eines hochwirksamen 
5 regulatorischen Bereichs produziert werden, dessen Aktivitat 
durch den Zelltyp bestiinmt werden kann, in den der Vektor 
eingebracht worden ist. Eine Erlauterung der Regulation der 
Genexpression mittels Antisense-Genen siehe in Weintraub, H. , 
et al., Antisense-RNA as a molecular tool for genetic analysis, 
10 Reviews - Trends in Genetics, Bd. 1(1) 1986. 

Ein weiterer Aspekt der Erfindung betrifft Wirtszellen, in die 
ein erf indungsgeiaaiSer rekombinanter Expressionsvektor eingebracht 
worden ist. Die Begriffe "Wirtszelle" und "rekombinante Wirts- 

15 zelle'' werden hier untereinander austauschbar verwendet. Selbst- 
verstandlich betref fen diese Begriffe nicht nur die bestirnmte 
Zielzelle, sondern auch die Nachkommen oder potentiellen Nach- 
kommen dieser Zelle. Da in auf einanderf olgenden Generationen auf- 
grund von Mutation oder Umwelteinf Ixissen bestimmte Modif ikationen 

20 auftreten konnen, sind diese Nachkommen nicht unbedingt mit der 
Parentalzelle identisch, sind jedoch inrnier noch vom Umfang des 
Begriffs, wie hier verwendet, umfasst. 

Unter Rekombinant oder Transgen beispielsweise rekombinanten 
25 Expressionsvektor oder rekombinanten Wirt oder Wirtszellen im 

Sinne der Erfindung ist zu verstehen, dass die erf indungsgemafien 
Nukleinsauren und/ oder deren natiirliche Regulationssequenzen an 
5 ' und 3 ' -Position der Nukleinsauren nicht in ihrer natiirlichen 
Umgebung sind, das hei&t entweder wurde die Lage der Sequenzen im 
30 Herkunf storganismus verandert oder in diesem wurden die Nuklein- 
saureseqijenzen und/oder die Regulationssequenzen mutiert oder die 
erf indungsgemaSen Nukleinsauresequenzen wurden in einen anderen 
Organismus als den Herkunf storganismus verbracht oder deren 
Regulationssequenzen- Auch Kombinationen dieser Veranderungen 
35 sind moglich. Unter naturlicher Umgebung ist die Lage einer 
Nukleinsauresequenz in einem Organismus zu verstehen, wie er 
in der Natur vorkommt, 

Eine Wirtszelle kann eine prokaryotische oder eukaryotische 
40 Zelle sein. Zum Beispiel kann eine Desaturase in Bakterienzellen, 
wie C. glutamicum, Insektenzellen, Pilzzellen oder Saugerzellen 
(wie Chinesischer Hamster-Ovarzellen (CHO) oder COS-Zellen) , 
Algen, Ciliaten, Pf lanzenzellen, Pilzen oder anderen Mikro- 
organismen, wie C. glutamicum, exprimiert werden. Andere 
45 geeignete Wirtszellen sind dem Fachmann gelaufig. 
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Vektor-DNA lasst sich in prokaryotische oder eukaryotische Zellen 
uber herkommliche Transformations- oder Transf ektionstechniken 
einbringen. Die Begriffe "Transformation" und "Transf ektion" , 
Konjugation und Transduktion, wie hier veirwendet, sollen eine 
5 Vielzahl von im Stand der Technik bekannten Verfahren ziun 

Einbringen fremder Nukleinsaure (z.B. DNA) in eine Wirtszelle, 
einschlielSlich Calciumphosphat- oder Calciiimchlorid-Coprazi- 
pitation, DEAE-Dextran-ve3rmittelte Transf ekt ion, Lipof ektion, 
naturliche Kompetenz, chemisch vermittelter Transfer, Elektro- 

10 poration oder Teilchenbeschuss , timfassen. Geeignete Verfahren 

zur Transformation oder Transf ektion von Wirts zellen, einschlieS- 
lich Pf lanzenzellen, lassen sich finden in Sambrook et al . 
(Molecular Cloning: A Laboratory Manual., 2. Auf 1 . , Cold Spring 
Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold 

15 Spring Harbor, NY, 1989) und anderen Labor -Handbiichern, wie 
Methods in Molecular Biology, 1995, Bd. 44, Agrobacterium 
protocols, Hrsgb: Gartland und Davey, Humana Press, Totowa, 
New Jersey. 

20 Uber die stabile Transf ektion von Sauger zellen ist bekannt, 
dass je nach ve2rwendetem Expressionsvektor und verwendeter 
Transf ektionstechnik nur ein kleiner Teil der Zellen die fremde 
DNA in ihr Genom integriert. Zur Identif ikation und Selektion 
dieser Integrant en wird gew5hnlich ein Gen, das einen selektier- 

25 baren Marker (z.B. Resistenz gegen Antibiotika) kodiert, zusainmen 
mit dem Gen von Interesse in die Wirtszellen eingebracht. Bevor- 
zugte selektierbare Marker umfassen solche, welche Resistenz 
gegen Medikamente, wie G418, Hygromycin und Methotrexat, ver- 
leihen, oder in Pflanzen solche, welche Resistenz gegen ein 

30 Herbizid, wie Glyphosphat oder Glufosinat, verleihen. Weitere ge- 
eignete Marker sind beispielsweise Marker, welche Gene kodieren, 
die an Biosynthesewegen von zum Beispiel Zuckern oder Aminosauren 
beteiligt sind, wie S-Galactodsidase, ura3 oder ilv2 , Marker, 
welche Gene, wie Luzif erase, gfp oder andere Fluoreszenzgene 

35 kodieren, sind ebenfalls geeignet. Diese Marker lassen sich in 
Mutanten verwenden, in denen diese Gene nicht funktionell sind, 
da sie beispielsweise mittels herkommlicher Verfahren deletiert 
worden sind. Ferner konnen Marker, welche eine Nukleinsaure 
kodieren, die einen selektierbaren Marker kodiert, in eine Wirts- 

40 zelle auf dem gleichen Vektor eingebracht werden, wie derjenige, 
der eine Desaturase kodiert, oder konnen auf einem gesonderten 
Vektor eingebracht werden. Zellen, die mit der eingebrachten 
Nukleinsaure stabil transf iziert worden sind, konnen zum Beispiel 
durch Medikamentens el ektion identif iziert werden (z.B. uberleben 

45 Zellen, die den selektierbaren Marker integriert haben, wohin- 
gegen die anderen Zellen absterben) • 
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Zur Erzeugiing eines homolog rekombinierten Mikroorganismus wird 
ein Vektor hergestellt, der zuinindest einen Abschnitt eines 
Desaturasegens enthalt, in den eine Deletion, Addition oder 
Substitution eingebracht worden ist, um dadurch das Desaturasegen 
5 zu verandem, z.B, funktionell zu disrumpieren. Dieses Desatura- 
segen ist vorzugsweise ein Phaeodactylum tricornutum Desaturase- 
gen, es kann jedoch ein Homologon oder Analogon aus anderen 
Organismen, sogar aus einer Sauger-, Pilz- oder Insektenquelle 
verwendet werden. Bei einer bevorzugten Aus fuhrungs form ist der 

10 Vektor so gestaltet, dass das endogene Desaturasegen bei homo- 
loger Rekombination funktionell disrumptiert wird (d.h. nicht 
langer ein funktionelles Protein kodiert, auch als Knock-out- 
Vektor bezeichnet) . Alternativ kann der Vektor so gestaltet 
sein, dass das endogene Desaturasegen bei homologer Rekombination 

15 mutiert oder anderweitig verandert wird, aber immer noch ein 
funktionelles Protein kodiert (z.B. kann der stromauf warts 
gelegene regulatorische Bereich so verandert sein, dass da- 
durch die Expression der endogenen Desaturase verandert wird) . 
Zur Erzeugung einer Punktmutation liber homologe Rekombination 

20 konnen auch als Chimeraplasty bekannte DNA-RNA-Hybride ver- 
wendet werden, die aus Cole-Strauss et al . , 1999, Nucleic 
Acids Research 27 ( 5 ): 1323-133 0 und Kmiec, Gene therapy, 19999, 
American Scientist, 87 (3 ): 240-247 bekannt sind. 

25 Im Vektor fur die homologe Rekombination ist der veranderte 
Abschnitt des Desaturasegens an seinem 5'- und 3 ' -Ende von 
zusatzlicher Nukleinsaure des Desaturasegens flankiert, so dass 
homologe Rekombination zwischen dem exogenen Desaturasegen, das 
auf dem Vektor vorliegt, und einem endogenen Desaturasegen in 

30 einem Mikroorganismus oder einer Pflanze moglich ist. Die zusatz- 
liche flankierende Desaturase-Nukleinsaure ist fur eine erfolg- 
reiche homologe Rekombination mit dem endogenen Gen hinreichend 
lang. Gewohnlich sind im Vektor mehrere hundert Basenpaare bis 
zu Kilobasen flankierende DNA (sowohl am 5 ' - als auch am 3 '-Ende) 

35 enthalten (eine Beschreibung von Vektoren zur homologen Rekombi- 
nation siehe z.B. in Thomas, K.R. , und Capecchi, M.R. (1987) 
Cell 51:503 oder der Rekombination in Physcomitrella patens 
auf cDNA-Basis in Strepp et al . , 1998, Proc. Natl. Acad. Sci. 
USA 95 (8) : 43 68-43 73) . Der Vektor wird in einen Mikroorganismus 

40 Oder eine Pf lanzenzelle (z.B. mittels Polyethylenglycol-ver- 
mittelter DNA) eingebracht, und Zellen, in denen das einge- 
brachte Desaturasegen mit dem endogenen Desaturasegen homolog 
rekombiniert ist, werden unter Vean^endung im Fachgebiet bekannter 
Techniken selektiert. 
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Bei einer anderen Ausftihrxingsf orm konnen rekombinante Organismen, 
wie Mikroorganismen, hergestellt werden, die ausgewahlte Systeme 
enthalten, welche eine regulierte Expression des eingebrachten 
Gens ermoglichen. Der Einschlu£ eines Desaturasegens in einem 
5 Vektor, wobei es unter die Kontrolle des lac-Operons gebracht 
wird, ermoglicht z.B. die Expression des Desaturasegens nur in 
Gegenwart von IPTG. Diese Regulations systeme sind im Fachgebiet 
bekannt . 

10 Eine erf indungsgemaiS^e Wirtszelle, wie eine prokaryotische oder 
eukaryotische Wirtszelle, in Kultur oder auf einem Feld wachsend, 
kann zur Produktion (d.h. Expression) einer Desaturase verwendet 
werden. In Pflanzen kann zusatzlich ein alternatives Verfahren 
durch direkten Transfer von DNA in sich entwickelnde Bliiten tiber 

15 Elektroporation oder Gentransfer mittels Agrobacterium ange- 
wendet werden. Die Erfindung stellt folglich ferner Verfahren 
zur Produktion von Desaturasen unter Verwendung der erfindungs- 
gemaiSen Wirtszellen bereit. Bei einer Ausfiihrungsf orm umfasst das 
Verfahren die Anzucht der erf indungsgemaSen Wirtszelle (in die 

20 ein rekombinanter Expressionsvektor , der eine Desaturase kodiert, 
eingebracht worden ist, oder in deren Genom ein Gen eingebracht 
worden ist, das eine Wildtyp- oder veranderte Desaturase kodiert) 
in einem geeigneten Medium, bis die Desaturase produziert worden 
ist- Das Verfahren umfasst bei einer weiteren Ausfuhrungsf orm das 

25 Isolieren der Desaturasen aus dem Mediiuti oder der Wirtszelle. 

Wirtszellen, die im Prinzip zum Aufnehmen der erfindungs- 
gemalSen Nukleinsaure, des erf indungsgemaSen Genproduktes 
Oder des erf indungsgemaSen Vektors geeignet sind, sind alle 

30 prokaryotischen oder eukaryotischen Organismen. Die vorteil- 
hafterweise verwendeten Wirt s organismen sind Organismen, wie 
Bakterien, Pilze, Hefen, Tier- oder Pf lanzenzellen. Weitere vor- 
teilhafte Organismen sind Tiere oder vorzugsweise Pflanzen oder 
Telle davon. Pilze, Hefen oder Pflanzen werden vorzugsweise ver- 

35 wendet, besonders bevorzugt Pilze oder Pflanzen, ganz besonders 
bevorzugt Pflanzen, wie Olfruchtpf lanzen, die groSe Mengen an 
Lipidverbindungen enthalten, wie Raps, Nachtkerze, Canola, 
ErdnusS/ Lein, Soja, Safflor, Sonnenblume, Borretsch, oder 
Pflanzen, wie Mais, Weizen, Roggen, Hafer, Triticale, Reis, 

40 Gerste, Baumwolle, Maniok, Pfeffer, Tagetes, Solanaceen-Pf lanzen, 
wie Kartoffel, Tabak, Aubergine und Tomate, Vicia-Arten, Erbse, 
Alfalfa, Buschpf lanzen (Kaffee, Kakao, Tee) , Salix-Arten, Baume 
(5lplame, KokosnuS) sowie ausdauernde Graser und Putter feld- 
friichte. Besonders bevorzugte erf indungsgem^Se Pflanzen sind 

45 Olfruchtpf lanzen, wie Soja, Erdnuss, Raps, Canola, Lein, Nacht- 
kerze, Sonnenblume, Safflor, Baume (Olpalme, Kokosnu£) . 
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D- Isolierte Desaturase 

Ein weiterer Aspekt der Erfindung betrifft isolierte Desaturasen 
und biologisch aktive Telle davon, Ein "isoliertes" oder "ge- 
5 reinigtes" Protein oder ein biologisch aktiver Tell davon ist 
im wesentlichen frei von zellularem Material, wenn es durch DNA- 
Rekorabinationstechniken produziert wird, oder von cheitiischen Vor- 
stufen Oder andern Chemikalien, wenn es chemisch synthetisiert 
wird. Der Begriff "im wesentlichen frei von zellularem Material" 

10 umfasst Desaturase-Praparationen, in denen das Protein von zellu- 
laren Komponenten der Zellen, in denen es natiirlich oder rekombi- 
nant produziert wird, getrennt ist. Bei einer Ausfuhrungsf orm um- 
fasst der Ausdruck "im wesentlichen frei von zellularem Material" 
Desaturase-Praparationen mit weniger als etwa 30 % (bezogen auf 

15 das Trockengewicht) nicht -Desaturase (hier auch als "ver-unreini- 
gendes Protein" bezeichnet) , starker bevorzugt weniger als etwa 
2 0 % nicht-Desaturase, noch starker bevorzugt weniger als etwa 
10 % nicht-Desaturase und am starksten bevorzugt weniger als etwa 
5 % nicht-Desaturase. Wenn die Desaturase oder ein biologisch 

20 aktiver Teil davon rekombinant hergestellt worden ist, ist sie/er 
auch im wesentlichen frei von Kulturmediiun, d.h. das Kulturmedium 
macht weniger als etwa 20 %, starker bevorzugt weniger als etwa 
10 % und am stSrksten bevorzugt weniger als etwa 5 % des Volumens 
der Proteinpraparation aus. Der Begriff "im wesentlichen frei von 

25 chemischen Vorstufen oder anderen Chemikalien" umfasst Desatura- 
se-Praparationen, in denen das Protein von chemischen Vorstufen 
oder anderen Chemikalien getrennt ist, die an der Synthese des 
Proteins beteiligt sind. Bei einer Aus ftihrungs form umfasst der 
Begriff "im wesentlichen frei von chemischen Vorstufen oder 

30 anderen Chemikalien" Desaturase-Praparationen mit weniger als 
etwa 30 % (bezogen auf das Trockengewicht) chemischen Vorstufen 
Oder nicht -Desaturase-Chemikalien, starker bevorzugt weniger als 
etwa 20 % chemischen Vorstufen oder nicht-Desaturase-Chemikalien, 
noch starker bevorzugt weniger als etwa 10 % chemischen Vorstufen 

35 oder nicht-Desaturase-Chemikalien und am starksten bevorzugt 

weniger als etwa 5 % chemischen Vorstufen oder nicht-Desaturase- 
Chemikalien. Bei bevorzugten Ausfuhrungsf ormen weisen isolierte 
Proteine oder biologisch aktive Telle davon keine verunreinigen- 
den Proteine aus dem gleichen Organismus auf, aus dem die 

40 Desaturase stammt. Diese Proteine werden gewohnlich durch 

rekombinante Expression zum Beispiel Phaeodactyliam tricornutum- 
Desaturase in Pflanzen wie Physcomitrella patens bzw. o.g. 
oder Mikroorganismen, beispielsweise Bakterien, wie E. coli. 
Bacillus subtilis, C. glutamicum, Pilzen, wie Mortierella, Hefe, 

45 wie Saccharomyces, oder Ciliaten wie Colpidium oder Algen wie 
Phaeodactylum hergestellt. 



wo 02/057464 



PCT/EP02/00461 



61 

Eine erf indungsgemafie isolierte Desaturase oder ein Teil davon 
kann auch am Stof fwechsel von z\am Aufbau von Zellmembranen in 
Phaeodactylum tricornutuia notwendigen Verbindungen oder am 
Transport von Molekiilen tiber diese Membranen teilnehmen. Bei 
5 bevorzugten Ausfiihrungsf ormen umfasst das Protein oder der Teil 
davon eine AminosSuresequenz , die ausreichend homolog zu einer 
Aminosaureseq[uenz der SEQ ID NO: 2, 4, 6 oder 12 ist, dass das 
Protein oder der Teil davon die Fahigkeit, am Stof fwechsel von 
zum Aufbau von Zellmembranen in Phaeodactylum tricornutum not- 

10 wendigen Verbindungen oder am Transport von Molekiilen liber diese 
Membranen teilzunehmen, beibeh^lt. Der Teil des Proteins ist vor- 
zugsweise ein biologisch aktiver Teil, wie hier beschrieben. Bei 
einer weiteren bevorzugten Ausfiihrungsf orm hat eine erfindungs- 
gemaSe Desaturase eine der in SEQ ID NO: 2, 4, 6 oder 12 

15 gezeigten Aminosauresequenzen. Bei einer weiteren bevorzugten 
Ausfiihrungsf orm hat die Desaturase eine Aminosauresequenz , 
die von einer Nukleotidsequenz kodiert wird, die, zum Beispiel 
unter stringenten Bedingungen, an eine Nukleotidsequenz der 
SEQ ID NO: 1, 3, 5 oder 11 hybridisiert . Bei noch einer weiteren 

20 bevorzugten Ausfiihrungsf orm hat die Desaturase eine Aminosaure- 
sequenz, die von einer Nukleotidsequenz kodiert wird, die min- 
destens etwa 50 bis 60 %, vorzugsweise mindestens etwa 60 bis 
70 %, starker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 %, 
90 bis 95 % und noch starker bevorzugt mindestens etwa 96 

25 97 %, 98 %, 99 % oder noch homologer zu einer der Aminosaure- 
sequenzen der SEQ ID NO: 2, 4, 6 oder 18 ist. Die erfindungs- 
gema£.e bevorzugte Desaturase besitzt vorzugsweise auch mindestens 
eine der hier beschriebenen Desaturase-Aktivitaten. Zum Beispiel 
umfasst eine erf indungsgemafie bevorzugte Desaturase eine Amino- 

30 s^uresequenz , die von einer Nukleotidsequenz kodiert wird, die, 
zum Beispiel unter stringenten Bedingungen, an eine Nukleotid- 
sec[uenz der SEQ ID NO: 1, 3, 5 oder 11 hybridisiert und am Stoff- 
wechsel von zum Aufbau von Zellmembranen in Phaeodactylum tri- 
cornutum notwendigen Verbindungen oder am Transport von Molekiilen 

35 iiber diese Membranen teilnehmen kann oder eine Doppelbindung in 
eine Fettsaure mit ein, zwei, drei oder vier Doppelbindungen \ind 
einer Kettenlange von Cis/ C20 oder C22 einfiihrt. 

Bei anderen Ausfiihrungsf ormen ist die Desaturase im wesentlichen 
40 homolog zu einer Aminosauresequenz der SEQ ID NO: 2, 4 oder 6 
und behalt die funktionelle Aktivitat des Proteins einer der 
Sequenzen der SEQ ID NO: 2, 4 oder 6 bei, ihre- Aminosauresequenz 
unterscheidet sich jedoch aufgrund von natiirlicher Variation oder 
Mutagenese, wie eingehend im obi gen Unterabschnitt I beschrieben. 
45 Bei einer weiteren Ausfiihrungsf onn ist die Desaturase folglich 
ein Protein, das eine' Aminosauresequenz -umfasst, die mindestens 
etwa 50 bis 60 %, vorzugsweise mindestens etwa 60 bis 70 % xmd 
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starker bevorzugt mindestens etwa 70 bis 80 %, 80 bis 90 %, 90' 
bis 95 % oind am starksten bevorzugt mindestens etwa 96 %/ 97 
98 %, 99 % Oder noch homologer zu einer vollstandigen Aminosaure- 
sequenz der SEQ ID NO: 2, 4 oder 6 ist und zumindest eine der 
5 hier beschriebenen Desaturase-Aktivitaten aufweist . Bei einer 
anderen Ausfuhriingsf orm betrifft die Erfindiing ein vollstandiges 
Phaeodactylum tricornutum-Protein, das im wesentlichen homolog zu 
einer vollstandigen Aminosauresequenz der SEQ ID NO: 2, 4 oder 6 
ist . 

10 

Biologisch aktive Telle einer Desaturase umfassen Peptide, 
umfassend Aminosauresequenzen, die von der Aminosauresequenz 
einer Desaturase hergeleitet sind, z.B. eine in SEQ ID NO: 2, 
4 oder 6 gezeigte Aminosauresequenz oder die Aminosauresequenz 

15 eines Proteins, das zu einer Desaturase homolog ist, welche 
weniger Aminosauren als die Vollangen-Desaturase oder das 
Voll^ngenprotein aufweisen, das zu einer Desaturase homolog 
ist, und zumindest eine Aktivitat einer Desaturase aufweisen. 
Gewohnlich umfassen biologisch aktive Telle (Peptide, z.B. 

20 Peptide, die zum Beispiel 5, 10, 15, 20, 30, 35, 36, 37, 38, 
39, 40, 50, 100 oder mehr Aminosauren lang sind) eine Domane 
Oder ein Motiv mit mindestens einer Aktivitat einer Desaturase. 
Uberdies ]<:6rm.en andere biologisch aktive Telle, in denen 
andere Bereiche des Proteins deletiert sind, durch rekombinante 

25 Techniken hergestellt und bezuglich einer oder mehrerer der 

hier beschriebenen Aktivitaten \intersucht werden. Die biologisch 
aktiven Telle einer Desaturase umfassen vorzugsweise ein/eine 
Oder mehrere ausgewahlte Domanen/ Motive oder Telle davon mit 
biologischer Aktivitat. 

30 

Desaturasen werden vorzugsweise durch DNA-Rekombinationstechniken 
hergestellt. Zum Beispiel wird ein das Protein kodierendes 
Nukleinsauremolekul in einen Expressionsvektor (wie vorstehend 
beschrieben) kloniert, der Expressionsvektor wird in eine 

35 Wirtszelle (wie vorstehend beschrieben) eingebracht, und die 
Desaturase wird in der Wirtszelle exprimiert. Die Desaturase 
kann dann durch ein geeignetes Reinigungsschema mittels Standard- 
Proteinreinigungstechniken aus den Zellen isoliert werden. Alter- 
nativ zur rekombinanten Expression kann eine Desaturase, ein 

40 -Polypeptid, oder -Peptid mittels Standard-Peptidsynthese- 

techniken chemisch synthetisiert werden. Uberdies kann native 
Desaturase aus Zellen (z.B. Endothelzellen) z.B. unter Verwendung 
eines Anti-Desaturase-Antikorpers isoliert werden, der durch 
Standardtechniken produziert werden kann, wobei eine erfindungs- 

45 gemafie Desaturase oder ein Fragment davon verwendet wird. 
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Die Erfindimg stellt auch chimare Desaturase-Proteine oder 
Desaturase-Fusionsproteine bereit. Wie hier verwendet, umfasst 
ein "chimares Desaturase-Protein" oder "Desaturase-Fusions- 
protein" ein Desaturase-Polypeptid, das f unktionsf ahig an ein 
5 nicht-Desaturase-Polypeptid gebimden ist. Ein "Desaturase-Poly- 
peptid" betrifft ein Polypeptid mit einer Aminosauresequenz , die 
einer Desaturase entspricht, wohingegen ein "nicht-Desaturase- 
Polypeptid'' ein Polypeptid mit einer Aminosaureseqiienz betrifft, 
die einem Protein entspricht, das im wesentlichen nicht homolog 

10 zu der Desaturase ist, z.B. ein Protein, das sich vom der 
Desaturase unterscheidet und aus dem gleichen oder einem 
anderen Organismus stammt. Innerhalb des Fusionsproteins 
soli der Begriff " f unktionsf ahig verbunden" bedeuten, dass 
das Desaturase-Polypeptid und das nicht-Desaturase-Polypeptid 

15 so miteinander fusioniert sind, dass beide Sequenzen die vor- 
hergesagte, der veirwendeten Sequenz zugeschriebene Funktion 
erfiillen. Das nicht-Desaturase-Polypeptid kann an den N-Terminus 
Oder den C-Terminus des Desaturase-Polypeptids fusioniert sein. 
Bei einer Aus ftihrungs form ist das Fusionsprotein zum Beispiel 

20 ein GST-Desaturase-Fusionsprotein, bei dem die Desaturase- 

Sequenzen an den C-Terminus der GST-Sequenzen fusioniert sind. 
Diese Fusionsproteine konnen die Reinigung der rekombinanten 
Desaturasen erleichtern. Bei einer weiteren Aus filhrungs form ist 
das Fusionsprotein eine Desaturase, die eine heterologe Signal- 

25 sequenz an ihrem N-Terminus aufweist. In bestimmten Wirtszellen 
(z.B. Sauger-Wirtszellen) kann die Expression und/oder Sekretion 
einer Desaturase durch Verwendung einer heterologen Signalsequenz 
gesteigert werden. 

30 Ein erf indungsgemaSes chimares Desaturase-Protein oder 

Desaturase-Fusionsprotein wird durch Standard-DNA-Rekombinations- 
techniken hergestellt. Zum Beispiel werden DNA-Fragmente , die 
unterschiedliche Polypeptidsequenzen kodieren, gemai^ herkomm- 
licher Techniken im Leseraster aneinander ligiert, indem 

35 beispielsweise glatte oder -liberhangende Enden zur Ligation, 
Restriktionsenzymspaltung zur Bereitstellung geeigneter Enden, 
Auffiillen kohasiver Enden, wie erf orderlich, Behandlung mit 
alkalischer Phosphatase, rnn ungewollte Verkniipfungen zu ver- 
meiden, und enzymatische Ligation eingesetzt werden. Bei einer 

40 weiteren Aus f^hrungs form kann das Fusionsgen durch herkommliche 
Techniken, einschlieSlich DNA-Syn these automat en, synthetisiert 
werden. Alternativ kann eine PCR-Amplif izierung von Genf ragmenten 
unter Verwendxing von Ankerprimern durchgeftihrt werden, die 
komplementare Uberhange zwischen auf einanderf olgenden Gen- 

45 fragmenten erzeugen, die anschlieSend miteinander hybridisiert 
und reamplif iziert werden konnen, so dass eine chimare Gensequenz 
erzeugt wird (siehe z\im Beispiel Current Protocols in Molecular 
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Biology, Hrsgb. Ausubel et al , , John Wiley & Sons: 1992). Uber- 
dies sind viele Expressionsvektoren kommerziell erhaltlicli, die 
bereits eine Fusionseinheit (z.B. ein GST-Polypeptid) kodieren. 
Eine Desaturase-kodierende Nukleinsaure kann in einen solchen 
5 Expressionsvektor kloniert werden, so dass die Fusionseinheit 
im Leseraster mit dem Desaturase-Protein verbunden ist. 

Homologe der Desaturase konnen durch Mutagenese, z.B. durch 
spezifische Punktmutation oder Verkiirzung der Desaturase, erzeugt 

10 werden. Der Begriff "Homologe", wie hier veirwendet, betrifft eine 
variante Form der Desaturase, die als Agonist oder Antagonist 
der Desaturase-Aktivitat wirkt . Ein Agonist der Desaturase kann 
im wesentlichen die gleiche Aktivitat wie die oder einen Teil 
der biologischen Aktivitaten der Desaturase beibehalten. Ein 

15 Antagonist der Desaturase kann eine oder mehrere Aktivitaten der 
naturlich vorkommenden Form der Desaturase durch ziom Beispiel 
kompetitive Bindung an ein stromabwarts oder -aufwarts gelegenes 
Element der Stof fwechselkaskade fur Zellmembrankomponenten, 
welche die Desaturase umfasst, oder durch Bindxing an eine 

20 Desaturase, welche den Transport von Verbindungen uber Zell- 
membranen vermittelt, hemmen, wodurch die Translokation gehemmt 
wird. 

Bei einer alternativen Ausfuhrungsf orm konnen Homologe der 
Desaturase durch Sichten kombinatorischer Banken von Mutanten, 

25 z.B. Verktirzungsmutanten, der Desaturase hinsichtlich Desaturase- 
Agonisten- oder -Antagonisten-Aktivitat identif iziert werden. Bei 
einer Ausfuhrungsf orm wird eine variegierte Bank von Desaturase- 
Varianten durch kombinatorische Mutagenese auf Nukleinsaure- 
ebene erzeugt und durch eine variegierte Genbank kodiert . Eine 

30 variegierte Bank von Desaturase-Varianten kann z.B. durch 

enzymatische Ligation eines Gemisches von synthetischen Oligo- 
nukleotiden in Gensequenzen hergestellt werden, so dass sich 
ein degenerierter Satz potentieller Desaturase-Sequenzen als 
individuelle Polypeptide oder alternativ als Satz groSerer 

35 Fusionsproteine (z.B. fur das Phage-Display) , die diesen Satz 
von Desaturase-Sequenzen enthalten, exprimieren lasst. Es gibt 
eine Vielzahl von Verfahren, die zur Herstellung von Banken 
potentieller Desaturase-Homologen aus einer degenerierten 
Oligonukleotidsequenz verwendet werden konnen. Die chemische 

40 Synthese einer degenerierten Gensequenz kann in einem DNA- 
Syntheseautomaten durchgefuhrt und das synthetische Gen dann 
in einen geeigneten Expressionsvektor ligiert werden. Die Ver- 
wendung eines degenerierten Satzes von Genen einnoglicht die 
Bereitstellung samtlicher Sequenzen, die den gewiinschten Satz 

45 an potentiellen Desaturase-Sequenzen kodieren, in einem Gemisch. 
Verfahren zur Synthese degenerierter Oligonukleotide sind im 
Fachgebiet bekannt (siehe z.B. Narang, S.A. (1983) Tetrahedron 
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39:3; Itakura et al . (1984) Annu. Rev. Biochem. 53:323; Itakura 
et al., (1984) Science 198:1056; Ike et al. (1983) Nucleic Acids 
Res. 11:477) . 

5 Zusatzlich konnen Banken von Desaturase-Fragmenten zur Her- 

stellung einer variegierten Population von Desaturase-Fragmenten 
fiir das Sichten und fur die anschlieEende Selektion von Homo- 
logen einer Desaturase verwendet werden. Bei einer Ausfiihrungs- 
form kann eine Bank von Fragment en der kodierenden Sequenz durch 

10 Behandeln eines doppelstr^ngigen PCR-Fragmentes einer kodierenden 
Desaturase-Sequenz mit einer Nuklease unter Bedingungen, unter 
denen Doppelstrangbriiche nur etwa eininal pro Molekiil erfolgen, 
Denaturieren der doppelstrangigen DNA, Renaturieren der DNA unter 
Bildung doppelstrangiger DNA, welche Sense/Antisense-Paare von 

15 verschiedenen Produkten mit Doppelstrangbr^chen umfassen kann, 

Entfernen einzelstrangiger Abschnitte aus neu gebildeten Duplices 
durch Behandlung mit Sl-Nuklease und Ligieren der resultierenden 
Fragmentbank in einen Expressionsvektor erzeugt werden. Mit 
diesem Verfahren kann eine Express ionsbank hergeleitet werden, 

20 die N-terminale, C-terminale und interne Fragmente der Desaturase 
verschiedener GroSen kodiert . 

Im Fachgebiet sind mehrere Techniken fur das Sichten von Gen- 
produkten in kombinatorischen Banken, die durch Punktmutationen 

25 Oder Verkiirzung hergestellt worden sind, und fiir das Sichten von 
cDNA-Banken nach Genprodukten mit einer ausgewahlten Eigenschaft 
bekannt. Diese Techniken lassen sich an das schnelle Sichtung 
der Genbanken anpassen, die durch kombinatorische Mutagenese 
von Desaturase-Homologen erzeugt worden sind. Die am haufigsten 

30 verwendet en Techniken zum Sichtung grower Genbanken, die einer 
Analyse mit hohem Durchsatz unte2nvorfen werden konnen, um- 
fassen gewohnlich das Klonieren der Genbank in replizierbare 
Expressionsvektoren, Trans formier en von geeigneten Zellen mit der 
resultierenden Vektorenbank und Exprimieren der kombinatorischen 

35 Gene unter Bedingungen, unter denen der Nachweis der gewiinschten 
Aktivitat die Isolation des Vektors, der das Gen kodiert, dessen 
Produkt nachgewiesen wurde, erleichtert. Recursive-Ensemble-Muta- 
genese (REM) , eine neue Technik, die die HMufigkeit funktioneller 
Mutanten in den Banken erhoht, kann in Kombination mit den 

40 Sichtungstests zur Identif ikation von Desaturase-Homologen ver- 
wendet werden (Arkin und Yourvan (1992) Proc. Natl, Acad. Sci . 
USA 89:7811-7815; Delgrave et al. (1993) Protein Engineering 
6(3) :327-331) . 

45 Eine weitere bekannte Technik zur Veranderung von katalytischen 
Eigenschaf ten von Enzymen bzw. deren codierenden Genen ist 
das "Gen-Shuffling" (siehe z.B. in Stemmer, PNAS 1994, 91: 
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10747-10751, WO9720078 oder W09813487), das eine Kombination von 
Genf ragmenten darstellt, wobei diese Neukombination zusatzlich 
noch durch fehlerhafte Polymerasekettenreaktionen variiert warden 
kann und somit eine hohe zu testende Sequenzdiversitat schafft. 
5 Voraussetzung fiir den Einsatz eines solchen Ansatzes ist jedoch 
ein geeignetes Screeningsystem, um die erstellte Gendiversitat 
auf Funktionalitat zu liberprufen. 

Insbesondere fiir die Sichtung von Desaturaseaktivitaten 
10 ist ein Sichtungsverfahren Voraussetzung, das PUFA-abhangig 
Enzymaktivitat (en) erfaiSt. Bzgl. Desaturaseaktivitaten mit 
Spezifitat fiir PUFAs kann man in Mucor-Species , die durch 
bekannte Trans formationsverfahren mit gewiinschten Genkonstrukten 
trans formierbar sind, die Toxizitat von Arachidonsaure in An- 
15 wesenlieit eines toxischen Metaboliten (hier: SalicylsM.ure oder 
Salicylsaurederivate) nutzen (Eroshin et al . , Mikrobiologiya, 
Vol. 65, No.l 1996, Seiten 31-36), um eine wachstiainsbasierte 
Erst sichtung durchzuf uhren, Resultierende Klone konnen dann einer 
Analyse ihrer Lipidinhaltstof f e mittels Gaschromatographie und 
20 Massenspektroskopie unterzogen werden, um Edukte und Produkte in 
Art iind Menge zu erfassen. 

Bei einer weiteren Ausf iihrungsf orm konnen Tests auf Zellbasis 
zur Analyse einer variegierten Desaturase-Bank unter Verwendimg 
25 von weiteren im Fachgebiet bekannten Verfahren ausgenutzt werden. 

E. Erf indungsgemaSe Verwendungen und Verfahren 

Die hier beschriebenen Nukleinsauremolekiile, Proteine, Protein- 

30 homologen, Fusionsproteine, Primer, Vektoren und Wirtszellen 
konnen bei einem oder mehreren der nachstehenden Verfahren ver- 
wendet werden: Identif ikation von Phaeodactylum und verwandten 
Organismen, Kartierung der Genome von Organismen, die mit 
Phaeodactylum tricornutum verwandt sind, Identif ikation und 

35 Lokalisierung von Phaeodactylum tricornutticu-Seqiienzen von 

Interesse, Evolutionsstudien, Bestimmung von Desaturase-Protein- 
bereichen, die ftir die Funktion notwendig sind. Modulation einer 
Desaturase-Aktivitat ; Modulation des Stof fwechsels einer oder 
mehrerer Zellmembrankomponenten; Modulation des Transmembran- 

40 transports einer oder mehrerer Verbindungen sowie Modulation der 
zellularen Produktion einer gewCinschten Verbindung, wie einer 
Feinchemikalie . Die erf indungsgemaSen Desaturase-Nukleinsaure- 
molekule haben eine Vielzahl von Verwendungen. Sie kdnnen 
zunachst zur Identif ikation eines Organismus als Phaeodactylum 

45 tricornutum oder als naher Verwandter davon verwendet werden. Sie 
konnen auch zur Identif ikation des Vorliegens von Phaeodactylum 
tricornutum oder eines Verwandten davon in einer Mischpopulation 
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von Mikroorganismen veinvendet warden. Die Erfindiing stellt die 
Nukleinsaureseqiienzen einer Reihe von Phaeodactylum tricornutiitn- 
Genen bereit; durch Sondieren der extrahierten genomischen DNA 
einer Kultur einer einheit lichen oder gemischten Population von 
5 Mikroorganismen unter stringenten Bedingungen mit einer Sonde, 
die einen Bereich eines Phaeodactylum tricornutum -Gens oder von 
Teilen davon iiberspannt, das fiir diesen Organismus einzigartig 
ist, kann man bestimmen, ob dieser Organismus vorliegt. Phaeo- 
dactylum tricornutiam selbst werden zur kommerziellen Produktion 
10 mehrfach ungesattigter Sauren verwendet und eignen daruber hinaus 
zur PUFA- Produktion auch in anderen Organismen insbesondere wenn 
erreicht werden soil, dass resultierende PUFAs auch in die Tri- 
acylglycerolf raktion eingebaut werden sollen. 

15 Ferner konnen die erf indungsgemaiSen Nukleinsaure- und Protein- 
molekiile als Marker fur spezifische Bereiche des Genoms dienen. 
Dies ist nicht nur zur Kartierung des Genoms, sondern auch fur 
funktionelle Phaeodactylum tricornutiom-Proteinen geeignet. Zur 
Identifikation des Genombereichs, an den ein bestimmtes DNA- 

20 bindendes Protein von Phaeodactylum tricornutum bindet, k6nnte 

das Phaeodactylum tricornutum-Genom zum Beispiel gespalten werden 
xind die Fragmente mit dem DNA-bindenden Protein ink-ubiert werden. 
Diejenigen, die das Protein binden, konnen zusatzlich mit den 
erf indungsgemaSen Nukleins^uremolekiilen, vorzugsweise mit leicht 

25 nachweisbaren Markierungen, sondiert werden; die Bindung eines 
solchen Nukleinsauremolekuls an das Genomf ragment ermoglicht die 
Lokalisierung des Fragments auf der Genomkarte von Phaeodactylum 
tricornutum und erleichtert, wenn dies mehrmals mit unterschied- 
lichen Enzymen durchgefiihrt wird, eine rasche Bestimmung der 

30 Nukleinsauresequenz, an die das Protein bindet. Die erf indungs- 
gemaSen Nukleinsauremolekule konnen zudem ausreichend homolog 
zu den Sequenzen verwandter Arten sein, dass diese Nukleinsaure- 
molekule als Marker fur die Konstruktion einer genomischen Karte 
bei ve^rwandten Pilzen oder Algen dienen kdnnen. 

35 

Die erf indungsgemaSen Desaturase-Nukleinsauremolekule eignen 
sich auch fur Evolutions- und Proteinstruktur-Untersuchungen. 
Die Stof fwechsel- und Transportprozesse, an denen die er- 
f indungsgemaSen Molekiile beteiligt sind, werden von vielen 

40 prokaryotischen und eukaryotischen Zellen genutzt; durch 
Vergleich der Sequenzen der erf indungsgemaSen Nukleinsaure- 
molekule mit solchen, die ahnliche Enzyme aus anderen Organismen 
kodieren, kann der Evolutions-Verwandschaf tsgrad der Organismen 
bestiirant werden. Entsprechend ermoglicht ein solcher Vergleich 

45 die Bestimmung, welche Sequenzbereiche konserviert sind und 

welche nicht, was bei' der Bestimmung von Bereichen des Proteins 
hilfreich sein kann, die ftir die Enzymfunktion essentiell sind. 
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Dieser Typ der Bestimmung zst fiir Proteinengineering-Unter- 
suchungen wertvoll und kann einen Hinweis darauf geben, wieviel 
Mutagenese das Protein tolerieren karm, olme die Funktion zu 
verlieren. 

5 

Die Manipulation der erf indungsgemaSen Desaturase-Nukleinsaure- 
molekiile kann zur Produktion von Desaturasen mit f unktionellen 
Unterschieden zu den Wildtyp-Desaturasen fiihren. Die Effizienz 
Oder Aktivitat dieser Proteine kann verbessert sein, sie konnen 

10 in groSeren Anzahlen als gewohnlich in der Zelle zugegen sein, 
Oder ihre Effizienz oder Aktivitat kann verringert sein. Ver- 
besserte Effizienz oder Aktivitat bedeutet beispielsweise, dass 
das Enzym eine hohere Selektivitat und/oder Aktivitat, vorzugs- 
weise eine mindestens 10 % h5here, besonders bevorzugt eine 

15 mindestens 20 % hohere Aktivitat, ganz besonders bevorzugt eine 
mindestens 3 0 % hohere Aktivitat als das urspriingliche Enzym 
aufweist . 

Es gibt eine Reihe von Mechanismen, durch die die Veranderung 

20 einer erf indungsgemaSen Desaturase die Ausbeute, Produktion 

und/oder Effizienz der Produktion einer Feinchemikalie, welche 
ein solches verandertes Protein enthalt, direkt beeinflussen 
kann. Die Gewinnung von Feinchemikalien-Verbindungen aus Kulturen 
von Ciliaten, Algen oder Pilzen im groSen MaSstab ist signifi- 

25 kant verbessert, wenn die Zelle die gewunschten Verbindungen 

sezerniert, da diese Verbindungen aus dem Kulturmedium (im Gegen- 
satz zur Extraktion aus der Masse der geziichteten Zellen) leicht 
gereinigt werden kdnnen. Ansonsten l^sst sich die Reinigxing ver- 
bessern, wenn die Zelle in vivo Verbindungen in einem speziali- 

30 sierten Kompartiment mit einer Art Konzentrationsmechanismus 
speichert. Bei Pflanzen, die Desaturasen exprimieren, kann ein 
gesteigerter Transport zu besserer Verteilung innerhalb des 
Pf lanzengewebes und der -organe fiihren. Durch VergroSern der 
Anzahl oder der Aktivitat von Transportermolekiilen, welche Fein- 

35 chemikalien aus der Zelle exportieren, kann es moglich sein, die 
Menge der produzierten Feinchemikalie, die im extrazellularen 
Mediiam zugegen ist, zu steigern, wodurch Ernte und Reinigung oder 
bei Pflanzen eine effizientere Verteilung erleichtert werden. Zur 
effizienten Uberproduktion einer oder mehrerer Feinchemikalien 

40 sind dagegen erhohte Mengen an Cofaktoren, Vorlauf ermolekulen und 
Zwischenverbindungen fur die geeigneten Biosynthesewege erforder- 
lich- Durch VergroSern der Anzahl und/oder der Aktivitat von 
Transport eirprot einen, die am Import von Nahrstoffen, wie Kohlen- 
stoffquellen (d.h. Zuckern) , Stickstof f quellen (d.h. Aminosauren, 

45 Ammoniums alz en) , Phosphat und Schwefel, beteiligt sind, kann 

man die Produktion einer Feinchemikalie aufgrund der Beseitigung 
aller Einschrankungen des NShrstof fangebots beim Biosynthese- 
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prozess verbessern. Fettsauren, wie PUFAs, und Lipide, die PUFAs 
enthalten, sind selbst wiinschenswerte Feinchemikalien; durch 
Optimieren der Aktivitat oder Erhohen der Anzahl einer oder 
mehrerer erf indungsgemalSer Desaturasen, die an der Biosynthese 
5 dieser Verbindungen beteiligt sind, oder durch Storen der Aktivi- 
tat einer oder mehrerer Desaturasen, die am Abbau dieser Ver- 
bindungen beteiligt sind, kann man somit die Ausbeute, Produktion 
und/ Oder Effizienz der Produktion von Fettsaure- und Lipidmole- 
kule in Ciliaten, Algen, Pflanzen, Pilzen, Hefen oder anderen 
10 Mikroorganismen steigern. 

Die Manipulation eines oder mehrerer erf indungsgemaSer 
Desaturase-Gene kann ebenfalls zu Desaturasen mit veranderten 
Aktivitaten fiihren, welche die Produktion einer oder mehrerer 

15 gewiinschter Feinchemikalien aus Algen, Pflanzen, Ciliaten oder 
Pilzen indirekt beeinf lussen. Die normalen biochemischen Stoff- 
wechselprozesse ftihren z.B. zur Produktion einer Vielzahl an 
Abf allprodukten (z.B. Wasserstof fperoxid und andere reaktive 
Sauerstof f spezies) , die diese Stof fwechselprozesse aktiv storen 

20 konnen (z.B. nitriert Peroxynitrit bekanntlich Tyrosin-Seiten- 
ketten, wodurch einige Enzyme mit Tyrosin im aktiven Zentrum 
inaktiviert warden (Groves, J.T. (1999) Curr. Opin. Chem. Biol. 
3(2) ; 226-235) ) . Diese Abf allprodukte werden zwar tiblicherweise 
ausgeschieden, aber die zur f ermentativen Produktion im groSen 

25 lyiaSstab verwendeten Zellen werden fiir die Uberproduktion einer 
Oder mehrerer Feinchemikalien optimiert und konnen somit mehr 
Abf allprodukte produzieren als fur eine Wildtypzelle ublich. 
Durch Optimieren der Aktivitat einer oder mehrerer erfindungs- 
gemaSer Desaturasen, die am Export von Abf allmolekulen beteiligt 

30 sind, kann man die Lebensf ahigkeit der Zelle verbessern und 
eine effiziente Stof fwechselaktivitat auf rechterhalten. Auch 
das Vorliegen hoher intrazellularer Mengen der gewiinschten Fein- 
chemikalie kann tatsachlich fiir die Zelle toxisch sein, so dass 
man durch Steigern der Fahigkeit der Zelle zur Sekretion dieser 

35 Verbindungen die Lebensf ahigkeit der Zelle verbessern kann. 

Die erf indungsgemaSen Desaturasen konnen ferner so manipuliert 
sein, dass die relativen Mengen verschiedener Lipid- und Fett- 
sauremolekule verandert werden. Dies kann eine entscheidende Aus- 

40 wirkung auf die Lipidzusammensetzung der Zellmembran haben. Da 
jeder Lipidtyp unterschiedliche physikalische Eigenschaf ten hat, 
kann eine Veranderung der Lipidzusammensetzung einer Membran die 
Membranf luiditat signifikant verandem. Anderungen der Membran- 
f luiditat konnen den Transport von Molekiilen iiber die Membran 

45 beeinf lussen, was, wie vorstehend erlautert, den Export von 
Abf allprodukten oder der produzierten Feinchemikalie oder den 
Import notwendiger Nahrstoffe modifizieren kann. Diese Anderungen 
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der Membranf luiditat konnen auch die Integritat der Zelle ent- 
scheidend beeinf lussen; Zellen itiit vergleichsweise schwacheren 
Membranen sind anf alliger- gegeniiber abiotischen und biotisciien 
Stressbedingungen, welche die Zelle beschadigen oder abtSten 
5 koTmen. Durch Manipulieren von Desaturasen, die an der Produktion 
von Fettsauren und Lipiden fiir den Membranauf bau beteiligt sind, 
so dass die resultierende Meinbran eine Meitibranzusammensetzung 
hat, die fur die in den Kulturen, die zur Produktion von Fein- 
chemikalien verwendet werden, herrschenden Umweltbedingungen 
10 empfanglicher sind, sollte ein groiSerer Anteil der Zellen liber- 
leben und sich vermehren, GroSere Mengen an produzierenden 
Zellen sollten sich in groSeren Ausbeuten, hoherer Produktion 
Oder Effizienz der Produktion der Feinchemikalie aus der Kultur 
manif estieren. 

15 

Die vorstehend genannten Mutagenesestrategien fiir Desaturasen, 
die zu erhohten Ausbeuten einer Feinchemikalie fiihren sollen, 
sollen nicht beschrankend sein; Variationen dieser Strategien 
sind dem Fachmann leicht ersichtlich. Unter Verwendung dieser 

20 Mechanismen und mithilfe der hier of fenbarten Mechanismen kQnnen 
die erf indungsgemaSen Nukleinsaure- und Proteinmolekule zur 
Erzeugung von Algen, . Ciliaten, Pflanzen, Tieren, Pilzen oder 
anderen Mikroorgani smen, wie C. glutamicum, verwendet werden, 
die mutierte Desaturase-Nukleins^ure- und Proteinmolekule expri- 

25 mieren, so dass die Ausbeute, Produktion und/oder Effizienz der 
Produktion einer gewiinschten Verbindung verbessert wird. Diese 
gewunschte Verbindung kann ein beliebiges naturliches Produkt von 
Algen, Ciliaten, Pflanzen, Tieren, Pilzen oder Bakterien sein, 
welches die Endprodukte von Biosynthesewegen und Zwischenprodukte 

30 natiirlich vorkommender Stof fwechselwege umfasst, sowie Molekiile, 
die im Stof fwechsel dieser Zellen nicht natiirlich vorkommen, die 
jedoch von den erf indungsgemaEen Zellen produziert werden, 

Eine weitere erf indungsgemaiSe Aus fuhrungs form ist ein Verfahren 
35 zur Produktion von PUFAs , wobei das Verfahren das Ziichten 

eines Organismus, der eine erf indungsgemaSe Nukleinsaure, ein 
erf indungsgemaSes Genkonstrukt oder einen erf indungsgemaSen 
Vektor umfasst, welche ein Polypeptid kodieren, das Cis-/ Cao™ 
Oder C22~Fettsauren mit mindestens zwei Doppelbindungen im 
40 Fettsauremolekiil urn mindestens zwei Kohlenstof f atome unter 
Bedingungen, unter denen PUFAs in dem Organismus produziert 
werden, verlangert, umfasst. Durch dieses Verfahren hergestellte 
PUFAs lassen sich durch Ernten der Organismen entweder aus 
der Kultur, in der sie wachsen, oder von dem Feld, Aufbrechen 
45 und/oder Extrahieren des geernteten Materials mit einem 

organischen Losiingsmittel isolieren. Aus diesem Losungsmittel 
kann das Ol, das Lipide, Phospholipide, Sphingolipide, Glyco- 
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lipide, Triacylglycerine und/oder freie Fettsatiren mit hoherem 

Gehalt an PUFAs enthalt, isoliert werden. Durch basische oder 
saure Hydrolyse der Lipide, Phospholipide, Sphingolipide, Glyco- 
lipide, Triacylglycerine konnen die freien Fettsauren mit hoherem 
5 Gehalt an PUFAs isoliert werden. Ein hoherer Gehalt an PUFAs 
bedeutet mindestens 5 %, vorzugsweise 10 %, besonders bevorzugt 
20 %, ganz besonders bevorzugt 40 % mehr PUFAs als der ursprung- 
liche Organismus, der keine zusatzliche Nukleinsaure, die die 
erf indungsgemaSe Desaturase kodiert, besitzt. 

10 

Vorzugsweise sind die durch dieses Verfahren produzierten PUFAs 
Ci8- Oder C2o-22~F^ttsaureinolekule mit mindestens zwei Doppel- 
bindungen im Fettsauremolekiil , vorzugsweise drei, vier, bei 
Kombination mit einer weiteren Elongasen und einer A-4 Desaturase 
15 fiinf Oder sechs Doppelbindungen • Diese Gig- oder C2o-22-Fettsaure- 
molekiile lassen sich aus dem Organismus in Form eines Ols, Lipids 
Oder einer freien Fettsaure isolieren. Geeignete Organismen sind 
beispielsweise die vorstehend erwahnten, Bevorzugte Organismen 
sind transgene Pflanzen. 

20 

Fine erf indungsgemaSe Aus ftihrungs form sind Ole, Lipide oder Fett- 
sauren oder Fraktionen davon, die durch das oben beschriebene 
Verfahren hergestellt worden sind, besonders bevorzugt 01, Lipid 
Oder eine Fettsaurezusammensetzung, die PUFAs umfassen und von 
25 transgenen Pflanzen herruhren. 

Eine weitere erf indungsgemafie Aus fuhrungs form ist die Verwendung 
des Ols, Lipids oder der Fettsaurezusammensetzung in Futt.er- 
mitteln, Nahrxingsmitteln, Kosmetika oder Phazinazeutika- 

30 

Ein weiterer Erf indungsgegenstand ist ein Verfahren zur 

Identif ikation eines Antagonisten oder Agonisten von Desaturasen, 

umf assend 

35 a) in Kontaktbringen der Zellen, die das Polypeptid der 

vorliegenden Erfindung exprimieren, mit einem Kandidaten- 
stof f ; 

b) Testen der DesaturaseaktivitMt ; 

40 

c) Vergleichen der Desaturaseaktivitat mit einer Standard- 
aktivitat in Abwesenheit des Kandidatenstof f s , wobei ein 
Anstieg der Desaturaseaktivitat uber den Standard anzeigt, 
daS der Kandidatenstof f ein Agonist und ein Verringerung 

45 der Desaturaseaktivitat anzeigt, daS der Kandidatenstof f 

ein Antagonist ist. 
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Der genannte Kandida tens toff kann ein chemisch synthetisierter 
Oder mikrobiologisch produzierter Stoff sein und z.B. in Zell- 
extrakten von z.B. Pflanzen, Tieren oder Mikroorganismen auf- 
treten. Weiterhin kann der genaimte Stoff zwar iiti Stand der 
5 Technik bekannt sein, aber bisher nicht bekannt sein als die 
Aktivitat der Desaturasen steigernd oder repremierend. Das Reak- 
tionsgemisch. kann ein zellfreier Extrakt sein oder eine Zelle 
oder Zellkultur umfassen. Geeignete Methoden sind dem Fachmann 
bekannt und werden z.B. allgeitiein beschrieben in Alberts, Mole- 
10 cular Biology the cell, 3^*^ Edition (1994), z.B. Kapitel 17. Die 
genannten Stoff e konnen z.B. zu dem Reaktionsgemisch oder dem 
Kulturmedium zugegeben werden oder den Zellen injiziert werden 
oder auf eine Pflanze gespriiht werden. 

15 Wenn eine Probe, die ein nach. der erf indungsgemaSen Methode 

aktiven Stoff beinhaltet, identif iziert wurde, dann ist es ent- 
weder moglich, den Stoff direkt von der ursprunglichen Probe zu 
isolieren oder man kann die Probe in verschiedene Gruppen teilen, 
z.B. wenn sie aus einer Vielzahl von verscbiedenen Komponenten 

20 besteht, um so die Zah.1 der verschiedenen Substanzen pro Probe 
zu reduzieren und dann das erf indungsgemaSe Verfahren mit einer 
solchen "Unterprobe" der ursprunglichen Probe zu wiederholen. 
Abhangig von der Komplexitat der Probe konnen die oben beschrie- 
benen Schritte mehrmals wiederholt werden, vorzugsweise bis die 

25 gemaS der erf indungsgemaSen Methode identif izierte Probe nur noch 
eine geringe Anzahl von Substanzen oder nur noch eine Substanz 
umfaSt. Vorzugsweise wird der gemaS der erf indungsgemaSen Methode 
identif izierte Stoff oder Derivate davon weiter formuliert, so, 
daS er fiir die Anwendung in der Pf lanzenziichtung oder Pflanzen- 

30 zell- oder Gewebekultur geeignet ist. 

Die Stoff e, die gemaS dem erf indungsgemS.Sen Verfahren getestet 
und identif iziert wurden, konnen sein: Expressionsbibliotheken, 
z.B. cDNA-Expressionsbibliotheken, Peptide, Proteine, Nukleins^u- 

35 ren, Antikorper, kleine organische Stoffe, Hormone, PNAs oder 
ahnliches (Milner, Nature Medicin 1 (1995), 879-880; Hupp, Cell. 
83 (1995), 237-245; Gibbs, Cell. 79 (1994), 193-198 und darin 
zitierte Referenzen) . Diese Stoffe kSnne auch fxinktionelle 
Derivate oder Analogon der bekannten Inhibitoren oder Aktivatoren 

40 sein. Verfahren zur Herstellung von chemischen Derivaten oder 
Analogon sind dem Fachmann 'bekannt . Die genannten Derivate und 
Analogon konnen gemaS Verfahren nach dem Stand der Technik 
getestet werden. Weiterhin kann computergestutztes Design oder 
Peptidomimetics zur Herstellung geeigneter Derivate und Analogon 

45 verwendet werden. Die Zelle oder das Gewebe, die/das fiir das 
erf indungsgemaKe Verfahren veirwendet werden kann, ist vorzugs- 
weise eine erf indungsgemaSe Wirtszelle, Pf lanzenzelle oder ein 
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Pf lanzengewebe, wie in den oben genannten Ausfiihrungsf ormen 
beschrieben . 

Entsprechend betrif ft die vorliegende Erfindung auch einen 
5 Stoff , der gemai^ den vorstehenden erf indungsgemaSen Verfahren 
identif iziert wurde. Der Stoff ist z.B. ein Homolog der 
erf indimgsgemajSen Desaturasen. Homologe der Desaturasen konnen 
durch Mutagenese, z.B. durch Punktmutation oder Deletion der 
Desaturasen, erzeugt werden. Hierin verwendet wird der Begriff 

10 "Homolog" als eine variante Form der Desaturasen, die als Agonist 
Oder Antagonist fur die Aktivitat der Desaturasen wirkt. Ein 
Agonist kann die im wesentlichen gleiche oder einen Tail der 
biologischen Aktivitat der Desaturasen haben. Ein Antagonist der 
Desaturasen kann eine oder mehr Aktivitaten der natiirlich vor- 

15 kommenden Formen der Desaturasen inhibieren, z.B. kompetitiv an 
ein Downstream od^r Upstream gelegenes Mitglied der Fettsaure- 
synthese-Stof fwechselwege, die die Desaturasen einschlieSen, 
binden oder an Desaturasen binden und dabei die Aktivitat 
reduzieren oder inhibieren. 

20 

AuSerdem betrif ft die vorliegende Erfindung auch ein AntikSrper 
oder ein Fragment davon, wie sie hierin beschrieben werden, der 
die Aktivitat der erf indungsgemalSen Desaturasen inhibiert. 

25 Bei einem Aspekt betrifft die vorliegende Erfindung ein Anti- 
korper, der spezifisch den erf indungsgemaSen oben beschriebenen 
Agonisten oder Antagonisten erkennt bzw. bindet. 

Ein weiterer Aspekt betrifft eine Zusammensetzung, die den Anti- 
30 kQrper, den nach dem erf indungsgemaSen Verfahren identif izierten 
Stopp Oder das Antisense-Molekiil umfaiSt. 

In einer weiteren Ausfuhrungsf orm betrifft die vorliegende 
Erfindung ein Kit, umfassend die erf indungsgemaSe Nukleinsaure, 

35 das erf indungsgemaSe Genkonstrukt , die erf indungsgemaSe Amino- 
sauresequenz , das erf indungsgemaSe Antisense-Nukleinsauremolektil , 
den erf indungsgemaSen Antikorper und/oder Zusammensetzung, einen 
Antagonisten oder Agonisten, der nach dem erf indungsgemaSen Ver- 
fahren hergestellt wurde, und/oder erf indiingsgemaSe Qle, Lipide 

40 und/oder Fettsauren oder eine Fraktion davon. Ebenso kann das 
Kit die erf indungsgemaSen Wirtszellen, Organismen, Pflanzen 
Oder Telle davon, erntbare Telle der erf indungsgemaSen Pflanzen 
Oder Vermehrungsmaterial oder aber auch den erf indungsgemaSen 
Antagonisten oder Agonisten umfassen. Die Komponenten des Kits 

45 der vorliegenden Erfindung k5nnen in geeigneten Containern, bei- 
spielsweise mit oder in Puf f ern oder anderen Losungen verpackt 
sein. Ein oder mehr der genannten Komponenten konnen in ein und 
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demselben Container verpackt sein. Zusatzlich oder alternativ 
konnen ein oder mehr der genannten Komponenten z.B. auf einer 
festen Oberflache adsorbiert sein, z.B. Nitrozellulosef ilter , 
Glasplatten, Chips, NyloniEiembranen oder Mikrotiterplatten. Das 
5 Kit kann ftir jede der hierin beschriebenen Methoden iind Aus- 
fiihriingsf ormen verwendet werden, z.B. fur die Produktion von 
Wirtszellen, transgenen Pflanzen, zur Detektion von homologen 
Seqiienzen, zur Identif ikation von Antagonisten oder Agonisten 
usw. Weiterhin kann das Kit Anleitungen ftir die Verwendung des 
10 Kits fur eine der genannten Anwendtingen enthalten. 

Diese Erfindung wird durch die nachstehenden Beispiele waiter 
veranschaulicht , die nicht als beschrankend aufgefaSt werden 
soil ten. Der Inhalt saintlicher in dieser Patentanmeldung 
15 zitierten Literaturstellen, Patentanmeldungen, Patente und 
verof fentlichten Patentanmeldungen ist hier durch Bezugnahme 
auf genommen . 

Beispielteil 

20 

Beispiel 1: Allgemeine Verfahren 

a) Allgemeine Klonierungsverf ahren: 

25 Klonierungsverf ahren, wie beispielsweise Restriktionsspaltungen, 
Agarosegelelektrophorese, Reinigung von DNA-Fragmenten, Transfer 
von Nukleinsauren auf Nitrocellulose- und Nylonmembranen, 
Verbindung von DNA-Fragmenten, Transformation von Escherichia 
coli- und Hefe-Zellen, Anzucht von Bakterien und Sequenz analyse 

30 rekombinanter DNA, wurden durchgefuhrt wie beschrieben in 
Sambrook et al . (1989) (Cold Spring Harbor Laboratory Press: 
ISBN 0-87969-309-6) oder Kaiser, Michaelis und Mitchell (1994) 
"Methods in Yeast Genetics" (Cold Spring Harbor Laboratoary Press: 
ISBN 0-87969-451-3). Die Transformation und Anzucht von Algen, 

35 wie Chlorella oder Phaeodactylum werden durchgefuhrt wie be- 
schrieben von El-Sheekh (1999), Biologia Plantaruin 42:209-216; 
Apt et al. (1996) Molecular and General Genetics 252 (5):872-9. 

b) Chemikalien 

40 

Die verwendeten Chemikalien wurden, wenn im Text nicht anders 
angegeben, in p. A.-Qualitat von den Firmen Fluka (Neu-Ulm) , 
Merck (Darmstadt) , Roth (Karlsruhe) , Serva (Heidelberg) und 
Sigma (Deisenhof en) bezogen. Losungen wurden unter Vein^rendung 
45 von reinem pyrogenf reiem Wasser, im nachstehenden Text als H2O 
bezeichnet, aus einer Milli-Q-Wassersystem-Wasserreinigungs- 
anlage (Millipore, Eschborn) hergestellt . Restriktionsendo- 
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nukleasen, DNA-modif izierende Enzyme und molekularbiologische 
Kits wurden bezogen von den Fiirmen AGS (Heidelberg) , Amersham 
(Braunschweig) , Biometra (Gottingen) , Boehxinger (Mannheim) , 
Genomed (Bad Oeynhausen) , New England Biolabs (Schwalbach/ 

5 Taxinus) / Novagen (Madison, Wisconsin, USA) , Perkin-Elmer 
(Weiterstadt) , Pharmacia (Freiburg) , Qiagen (Hilden) lond 
Stratagene (Amsterdam, Niederlande) . Wenn nicht anders ange- 

• geben, wurden sie nach den Anweisungen des Herstellers ver- 
wendet . 

10 

c) Zellmaterial 

Die erf indungsgemaSen isolierten Nukleinsauresequenzen sind im 
Genom eines Phaeodactylum tricomutum UTEX646-Stammes enthalten, 
15 der uber die Algensammlung der University of Texas, Austin ver- 
ftigbar ist . 

Phaeodactylum tricornutura wurde bei 25^0 mit einem Licht/Dunkel 
Rhythmus von 14:10 Stunden bei 22°C und 35 microEinstein (ent- 
20 spricht micromol Photonen pro Quadratmeter und Sekunde) in Glas- 
rShren kultiviert, die von unten mit Luft begast wurden, 

Als Kulturmedium fiir Phaeodactylum tricornutum wurde das f /2 
Kulturmedium mit 10 % organischen Medium nach Guillard, R.R.L. 
25 verwendet (1975; Culture of phytoplankton for feeding marine 

invertebrates. In: Smith, W.L. and Chanley, M.H. (Eds.) Culture 
of marine Invertebrate animals, NY Plenum Press, pp. 29-60.): 
Es enthait 

30 995,5 ml Seewasser (artif iziell) 

1 ml NaN03 (75 g/1) , 1 ml NaH2P04 (5 g/1) , 1 ml Spurenelemente- 
losung, 1 ml Tris/Cl pH 8.0, 0 . 5 ml f/2 Vitaminlosung 

Spurenelementelosung: Na2EDTA (4,36 g/1), FeCls (3,15 g/1), 
35 Primare Spurenelemente : CuS04 (10 g/1), ZnS04 (22 g/1), C0CI2 
(10 g/1), MnCl2 (18 g/1), NaMo04 (6,3 g/1) 

f/2 Vitaminlosung: Biotin: 10 mg/1. Thiamin 200 mg/1, Vit Bl2 
0,1 mg/1 

org-Medium: Na-Acetat (1 g/1), Glucose (6 g/1), Na-Succinat 
40 (3 g/1), Bacto-Trypton (4 g/1), Hefe-Extrakt (2 g/1) 



45 
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Beispiel : 2 Isolierung von Gesamt-DNA aus Phaeodactylum tri- 
cornutum UTEX646 fiir Hybridisierungsexperimente 

Die Einzelheiten der Isolierung von Gesamt-DNA betreffen die Auf- 
5 arbeitung von Pf lanzenmaterial mit einem Frischgewicht von einem 
Graiton. 

CTAB-Puffer: 2 % (Gew./Vol.) N-Acetyl-N, N, N-triitiethylammoniiom- 
bromid (CTAB) ; 100 mM Tris-HCl, pH 8,0; 1,4 M NaCl; 20 mM EDTA. 

10 

N-Laurylsarkosin-Puf fer : 10 % (Gew./Vol.) N-Laurylsarkosin; 
100 mM Tris-HCl, pH 8,0; 20 mM EDTA. 

Phaeodactylum tricornutiun--2ellmaterial wurde unter fltissigem 

15 Stickstoff in einem Morser verrieben, so dass ein feines Pulver 
erhalten wurde, und in 2 ml-Eppendorf gef aSe iiberftihrt. Das ge- 
frorene Pf lanzenmaterial wurde dann mit einer Schicht von 1 ml 
Zersetzungspuf fer (1 ml CTAB-Puffer, 100 ml N-Laurylsarkosin- 
Puffer, 2 0 ml S-Mercaptoethanol und 10 ml Proteinase K-L6sung, 

20 10 mg/ml) uberschichtet und eine Stunde unter kontinuierlichem 
Sch-Citteln bei 60°C inkubiert. Das erhaltene Homogenat wurde 
in zwei Eppendorf gef alSe (2 ml) aufgeteilt und zweimal durch 
Schiitteln mit dem gleichen Volumen Chlorof oinn/Isoamylalkohol 
(24:1) extrahiert. Zur Phasentrennxing wurde eine Zentrifugation 

25 bei 8000 x g und RT (= Raumtemperatur = - 23^C) jeweils 15 min 

lang durchgef uhrt . Die DNA wurde dann 30 min unter Verwendung von 
eiskaltem Isopropanol bei -70°C gefallt. Die gefallte DNA wurde 
bei 10000 g 30 min bei 4°C sedimentiert und in 180 ml TE-Puffer 
(Sambrook et al., 1989, Cold Spring Harbor Laboratory Press: ISBN 

30 0-87969-309-6) resuspendiert . Zur weiteren Reinigung wurde die 

DNA mit NaCl (1,2 M Endkonzentration) behandelt und erneut 3 0 min 
unter Verwendung des zweifachen Volumens an absolutem Ethanol bei 
-70°C gefallt. Nach einem Waschschritt mit 70 % Ethanol wurde die 
DNA getrocknet und anschlieSend in 50 ml H2O + RNAse (50 mg/ml 

35 Endkonzentration) aufgenommen. Die DNA wurde uber Nacht bei 4°C 
gelost und die RNAse-Spaltung wurde anschlieSend 1 Std. bei 
37°C durchgef uhrt . Die Aufbewahrung der DNA erfolgte bei 4''C. 

Beispiel 3: Isolierung von Gesamt-RNA und poly(A)+-RNA aus 
40 Pflanzen und Phaeodactylum tricornutiam 

Die Isolierung von Gesamt-RNA aus Pflanzen wie Lein und Raps 
etc . erf olgt nach einer bei Logemann et al beschriebenen 
Methode (1987, Anal. Biochem. 163, 21) isoliert. Aus Moos kann 
45 die Gesamt-RNA Protonema-Gewebe nach dem GTC-Verf ahren (Reski 
et al., 1994, Mol . Gen. Genet., 244:352-359) gewonnen werden. 
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RNA Isolierung aus Phaeodactylum tricornutiim: 

Tief gef rorene Algenproben {- 70^0 warden in einem eiskaltem 
Morser unter Flussigstickstof f zu f einem Pulver zerreiben. 
5 2 Volmnen Homogenisationsmediiim (12,024 g Sorbitol, 40,0 ml IM 
Tris-HCl, pH 9 (0,2 M) ; 12,0 ml 5 M NaCl (0,3 M) , 8,0 ml 250 mM 
EDTA, 761,0 mg EGTA, 40,0 ml 10 % SDS wurden auf 200 ml mit H2O 
aufgefullt und der pH auf 8,5 eingestellt) und 4 Volumen Phenol 
mit 0,2 % Mercaptoethanol wurden bei 40 bis 50*^C unter gutem 
10 Mischen zu gefrorenem Zellpulver gegeben. Danach wurden 2 Volumen 
Chloroform hinzufiigen und fur 15 min kraftig geriihrt. Es wurde 
10 min bei 10000 g zentrifugiert und die wassrige Phase mit 
Phenol/Chlorof onu (2 Vol) und abschlieSend mit Chloroform 
extrahiert . 

15 

Das erhaltene Volumen der wassrigen Phase wurde mit 1/20 Vol 
4 M Na-Acetat (pH 6) und 1 Vol Isopropanol (eiskalt) versetzet 
und die Nukleinsauren bei -20<^C uber Nacht (= UN) gefallt. 
AnschlieSend wurde 30 min bei 10000 g zentrifugiert und der 

20 Uberstand abgesogen. Es folgte ein Waschschritt mit 70 % EtOH 
und erneute Zentrif ugation. Das Sediment wurde in Tris-Borat- 
Puffer (80 mM Tris-Borat-Puf f er , 10 mM EDTA, pH 7,0) aufgenommen. 
Dann wurde der Uberstand mit 1/3 Vol 8 M LiCl versetzt, gemischt 
30 min bei 4°C inkubiert. Nach erneutem zentrif ugieren wurde 

25 das Sediment mit 70 % Ethanol gewaschen, zentrifugiert und das 
Sediment in RNAse-f reiem Wasser gelost. 

Die Isolierung von poly (A) ^-RNA erfolgte unter Verwendung von Dyna 
Beads® (Dynal, Oslo, Finnland) nach den Anweisungen im Protokoll 
30 des Herstellers. 

Nach der Bestimmung der RNA- oder poly (A) +-RNA-Konzentration wurde 
die RNA durch Zugabe von 1/10 Volumina 3 M Natriumacetat , pH 4,6, 
und 2 Volumina Ethanol gefallt und bei -70°C aufbewahrt. 

35 

Fur die Analyse wurden jeweils 20 \Xg RNA in einem Formaldehyd- 
haltigen l,5%igen Agarosegel aufgetrennt und auf Nylon 
Membranen (Hybond, Amersham) uberfiihrt. Der Nachweis spezifischer 
Transkripte wurde wie bei Amasino beschrieben durchgefiihrt 
40 ((1986) Anal. Biochem. 152, 304)). 

Beispiel 4: Konstruktion der cDNA-Bank 

Zur Konstruktion der cDNA-Bank aus Phaeodactylum tricornutiam 
45 wurde die Erststrangsynthese unter Verwendung von Reverser 
Transkriptase aus Maus-Leukamie-Virus (Roche, Mannheim, 
Deutschland) und Oligo-d (T) -Primern, die Zweitstrangsynthese 
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durch Inkubation mit DNA-Polymerase I, Klenow-Enzym und RNAse 
H-Spaltiing bei'l2°C (2 Std.), 16°C (1 Std.) und 22°C (1 STd. ) 
erzielt. Die Reaktion wurde durch Inkubation bei 65°C (10 min) 
gestoppt und anschlieSend auf Eis uberfiihrt. Doppelstrangige DNA- 
5 Molekiile wurde mit T4-DNA-PolYitierase (Roche, Mannheim) bei 37°C 
(30 min) mit glatten Enden versehen. Die Nukleotide wurden durch 
Phenol /Chloroform-Extrakt ion und Sephadex-GSO-Zentrifugiersaulen 
entfernt. EcoRI/XhoI-Adapter (Pharmacia, Freiburg, Deutschland) 
wurden mittels T4-DNA-Ligase (Roche, 12 °C, liber Nacht) an die 

10 cDNA-Enden ligiert, mit Xhol nachgeschnitten und durch Inkubation 
mit Polynukleotidkinase (Roche, 37°C, 30 min) phosphoryliert . 
Dieses Gemisch wurde der Trennung auf einem Low-Melting-Agarose- 
Gel unterworfen. DNA-Molekule uber 3 00 Basenpaaren wurden aus dem 
Gel eluiert, Phenol-extrahiert , auf Elutip-D-Saulen (Schleicher 

15 und Schull, Dassel, Deutschland) konzentriert xmd an Vektorarme 
ligiert und in lambda-ZAP-Express-Phagen unter Ver*wendung des 
Gigapack Gold-Kits (Stratagene, Amsterdam, Niederlande) verpackt, 
wobei Material des Herstellers verwendet und seine Anweisungen 
befolgt wurden. 

20 

Beispiel 5 : DNA-Sequenzierung und Computeranalyse 

cDNA-Banken, wie im Beispiel 4 beschrieben, wurden zur DNA- 
Sequenzierung nach Standardverf ahren, insbesondere durch das 

25 Kettenterminationsverfahren unter Verwendung des ABI PRISM Big 
Dye Terminator Cycle Seqnjencing Ready Reaction-Kit (Perkin- 
Elmer, Weiterstadt, Deutschland), verwendet. Die Sequenzierung 
zufalliger, vereinzelter Klone wurde anschliei2.end an die 
praparative Plasmidgewinnung aus cDNA-Banken iiber in vivo-Massen- 

30 excision und Retrans formation von DHIOB auf Agarplatten durch- 
gefuhrt (Einzelheiten zu Material und Protokoll von Stratagene, 
Amsterdam, Niederlande) . Plasmid-DNA wurde aus uber Nacht 
gezuchteten E. coli-Kulturen, die in Luria-Briihe mit Ampicillin 
(siehe Sambrook et al. (1989) (Cold Spring Harbor Laboratory 

35 Press: ISBN 0-87969-309-6)) geztichtet worden waren, an einem 
Qiagen-DNA-Praparations-Roboter (Qiagen, Hilden) nach den 
Protokollen des Herstellers prapariert. Sequenzierprimer mit 
den f olgenden Nukleotidsequenzen wurden verwendet : 

40 5 ' -CAGGAAACAGCTATGACC-3 ' 
5 ' -CTAAAGGGAACAAAAGCTG-3 ' 
5 ' -TGTAAAACGACGGCCAGT-3 ' 

Die Sequenzen wurden unter Verwendung des Standard-Sof twarepa- 
45 kets EST-MAH:, das kommerziell von Bio-Max (Miinchen, Deutschland) 
geliefert wird, prozessiert und annotiert . Durch Nutzung von 
Vergleichsalgorithmen und unter Verwendiang der in SEQ ID NO: 8 
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dargestellten Suchsequenz wurde mithilfe des BLAST-Programms nach 
homologen Genen gesucht (Altschul et al . (1997) "Gapped BLAST and 
PSI-BLAST: a new generation of protein database search programs". 
Nucleic Acids Res. 25:3389-3402.). Zwei Sequenzen aus Phaeo- 
5 dactylum tricornutum mit Homologien zur Suchsequenz aus Physco- 
mitrella patens wurden eingehender charakterisiert . 

Beispiel 5a: Isolation von Desaturasen aus Phaeodactylum tri- 
cornutum liber Polymerase Kettenreaktion mithilfe 
10 degenerierter Oligonukleotide : 

Mithilfe von publizierten Desaturasen 'kormBn Motive identif iziert 
werden, die fur A-5 und A-6 Desaturasen typisch sind. Im folgen- 
den sind Oligonukleotidsequenzen mit moglichen Variationen dar- 

15 gestellt . Unter der Oligonukleotidsequenz ist im Ein-Buchstaben- 
code die Aminosaure dargestellt, von der die Basenkombination 
abgeleitet werden kann. Z.B. bedeutet A/G, daS an dieser Position 
bei der Synthese des Bausteins statistisch gleichverteilt ent- 
weder ein A oder ein G in das Oligonukleotid eingebaut wird, 

20 da das von der korrespondierenden Aminosaure abgeleitete Basen- 
triplett entweder ein AAA oder ein AAG sein kann. Die DNA Sequenz 
kann auch ein Inosin (i) enthalten, wenn die Bestimmung einer 
Base an dieser Position aufgrund des genetischen Codes drei 
Oder vier unterschiedliche Basen erlaubt. Folgende Sequenzen 

25 und Primer konnen verwendet werden: 



5 ' -Vorwarts-Primer : 





Fla: 


TGG 


TGG 


AA 


A/G 


TGG 


AAi 


CA T/C AA 






Fib: 


TGG 


TGG 


AA 


A/G 


TGG 


ACi 


CA T/C AA 




30 


Fla: 


W 


W 


K 




W 


N/T 


H K/N 






Fib: 


W 


w 


K 




W 


K 


H ^ K/N 






F2a: 


Gi 


TGG 


AA 


A/G 


GAi 


A/C Ai 


CA T/C AA 






F2b: 


Gi 


TGG 


AA 


A/G 


TTG 


A/C Ai 


CA T/C AA 




35 


F2a: 


G/W 


W 


K 




E/D 


K/Q/N 


H K/N 






F2b: 


G/W 


W 


K 




W 


K/Q/N 


H K/N 






F3a: 


T A/T i 




TTG 


AAi 


A/C A 


A/G C/A G/A i 


CA 




F3b: 


T A/T i 




TTG 


AAi 


A/C A 


A/G CAi 


CA 




F3a: 


W 






W 


K/N 


H/N 


R/Q 


H 


40 


F3b: 


Y 






W 


K/N 


H/N 


R/Q 


H 




F4a: 




GTi TGG A 


A/T G/A GA A/G CA A/G 


CA 




F4b: 




GTi TGG A 


A/T G/A A/T A T/C CA A/G 


CA 




F4a: 




V 




w 


K/M 


E 


Q 


H 




F4b: 




V 




w 


K/M 


N/Y Q 


H 


45 


F5al: 




CA 


T/C TA T/C 


TGG AA 


A/G AA T/C CA G 


C 




F5al: 




CA 


T/C TA T/C 


TGG AA 


A/G AA T/C CA A 


C 




FSal: 




H 






Y 


W K 


N Q 


H/ 
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F6a: TTG TTG AAi A/C A A/G AA i CA T/C AA 

F6a: W W K/N H/N K/N H K/N 

3 ' - Reverse Primer 

5 Rib: GG A/G AA iAG G/A TG G/A TG T/C TC 

Rib: GG A/G AA iAA G/A TG G/A TG T/C TC 

Rla: P F L H H E 

Rib: P F ' F H H E 

R2al: AA iAG A/G TG A/G TG iA C/T iA/G T/C TG 

10 R2a2: AA T/C AA A/G TG A/G TG iA C/T iA/G T/C TG 

R2al: F L H H V/I V/A Q 

R3al: AT iTG iGG A/G AA iAA A/G TG A/G TG 

R3a2: AT A/G TT iGG A/G AA iAA A/G TG A/G TG 

R3a3: AT iTG iGG A/G AA iAG A/G TG A/GTG 

15 R3a4: , AT A/G TT iGG A/G AA iAG A/G TG A/G TG 

R3al: I/M H/Q P F F H H 

R3a2: I/M N P F L H H 

R4al: CT iGG A/G AA iA A/G A/G TG A/G TG 

R4a2: GA iGG A/G AA iA A/G A/G TG A/G TG 

20 R4a3: GT iGG A/G AA iA A/G A/G TG A/G TG 

R4al: = T/R/S P F F/L H H 

R5al: AA iAA A/G TG A/G TG T/C TC T/A/G AT T/C TG 

R5a2: AA iAG A/G TG A/G TG T/C TC T/A/G AT T/C TG 

R5al: F F H H E I Q 

25 R5a2: F L H H E I Q 

R6al: T iGG iA A/G iAA A/G TG A/G TG iAC 

R6al: T iGG iA A/G iAG A/G TG A/G TG iAC 

R6al: T/N P L F/L H H V 



3Q Aufgrund verschiedener Variationsmoglichkeiten sind viele 

abgeleitete Oligonukleotide moglich, jedoch uberraschenderweise 
gefunden wurde, dass dargestellte Oligonukleotide besonders zur 
Isolation von Desaturasen geeignet sein konnen- 

32 Die Primer konnen in alien Kombinationen fur Polymerase Ketten- 
reaktionen eingesetzt werden. Mithilfe einzelner Kombinationen 
konnten Desaturase-Fragmente isoliert, wenn nachfolgende 
Bedingungen berucksichtigt wurden: Fur PGR Reaktionen wurden 
jeweils 10 nMol Primer und 10 ng einer durch in vivo Excision 

40 gewonnenen Plasmidbank eingesetzt. Die Plasmidbank konnte nach 
Protokollen des Hers tellers (Stratagene) aus der Phagenbank 
isoliert werden. Die PCR-Reaktion wurde in einem Thermocycler 
(Biometra) mit der Pfu-DNA-Polymerase (Stratagene) und dem 
folgenden Tempera turprogramm durchgef uhrt : 3 min bei 96°C, gefolgt 

45 von 3 5 Zyklen mit 30 s bei 96<^C, 30 s bei 55<^C und 1 min bei 72<^C, 
Dabei wurde die Anlagerungstemperatur nach dem ersten Schritt von 
550c schrittweise um je 3°C erniedrigt und nach dem ftinften Zyklus 
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eine Aalagerungstemperatur - von 40^C beibehalten, Letztlich wurde 
ein Zyklus mit 10 min bei 72^0 durchgefiihrt und der Ansatz durch 
Ktihlen auf 4^0 beendet. 

5 Die Primerkombination F6a und R4a2 sind im Text unterstrichen 
gekennzeichnet und konnten erfolgreich zur Isolierung eines 
Desaturasefragitientes genutzt warden. Das resultierende Fragment 
konnte durch Sequenzierung verifiziert werden und zeigte Homo- 
logien zu einer Desaturase mit der Genbank Accession Nr. T3 6617 

10 aus Streptomyces coelicolor. Die Homologie wurde mithilfe des 
BLASTP Programmes erhalten. Der Vergleich ist in Figur 4 dar- 
gestellt. Es ergaben sich Identitaten von 34 % und eine Homo- 
logie von 43 % zu Sequenz T3 6617. Das DNA-Fragment wurde gemaS 
Beispiel 7 in einem Hybridisierungs experiment zur Isolierung 

15 eines Vollangengens nach Standardbedingungen erf indungsgemaS 
eingesetzt . 

Die Codierregion einer so isolierten DNA-Sequenz wurde durch. 
Ubersetzung des genetischen Codes in eine Polypeptidsequenz 

20 erhalten. In SEQ ID NO: 3 ist eine 1434 Basenpaare lange 

Sequenz dargestellt, die durch beschriebenes Verfahren isoliert 
werden konnte. Die Sequenz besitzt ein Startcodon in Position 1 
bis 3 und ein Stopcodon in Position 1432-1434 und konnte in ein 
477 Aminosauren langes Polypeptid ubersetzt werden. Durch Ver- 

25 gleich mit einer in WO 98 46763 beschriebenen Gensequenz wurde 
gefunden, dass ein nicht identisches aber homologes Fragment 
aus Phaeodactylum tricornutum codierend fiir 87 Aminosauren 
vorbeschrieben wurde. Jedoch offenbart WO 98/46763 weder eine 
vollstandige, funktionell aktive Desaturase noch Positions- 

30 Oder Substratspezif iat . Dies wird auch dadurch deutlich, dass 
sowohl Homologien zur A-5, als auch zur A-6-Desaturase aus 
Mortierella alpina berichtet werden, ohne eine genaue Funktion 
festzulegen. Die erf indungsgemaSe Sequenz hingegen codiert fiir 
eine funktionell aktive A-6-Acyl Lipid Desaturase. 

35 

Beispiel 6: Identif izierung von DNA Sequenzen codierend fur 
Desaturasen aus Phaeodactylum tricornutum 

Die "Volllangensequenz der A-6-Acyl Lipid Desaturase Pp_des6 
40 AJ222980 (NCBI Genbank Accession Nr.) aus dem Moos Physco- 

mitrella patens (siehe auch Tabelle 1) sowie die A-12-acyl Lipid 
Desaturase Sequenz (Tabelle 1 siehe Ma_desl2) aus Mortierella 
alpina AF110509 (AF110509 NCBI Genbank Accession Nr.) wurden 
ftir Sequenzvergleiche mithilfe des TBLASTN Suchalgorhythmus 
45 eingesetzt. 
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Die EST-Sequenzen PT0010070010R, PT001072031R sowie PT001078032R 
wurden zunachst aufgrund schwacher Homologien mit den Such- 
sequenzen aus Physcomitrella und Mortierella unter weiteren 
Kandidatengenen als Zielgen in Betracht gezogen. In Figur 1 und 
5 in Figur 2 sowie Figur 2a ist das Ergebnis der zwei gefundenen 
est-Sequenzen dargestellt. Die gefundenen Sequenzen sind Teil 
der erf indungsgemaSen Nukleinsauren aus SEQ ID NO: 1 (Genname: 
Pt_des5, eigene Datenbank Nr. der Erfinder PT001078032R) , 
SEQ ID NO: 5. (Genname: Pt_desl2, eigene Datenbank NR. der 

10 Erfinder PT0010070010R) xind SEQ ID NO: 11 (Genname: Pt_desl2.2, 
eigene Datenbank des Erfinders PT001072031R) . Buchstaben zeigen 
identische Aminosauren an, wahrend das Pluszeichen eine chemisch 
ahnliche Aminosaure bedeutet . Die Identitaten bzw. Homologien 
aller erf indungsgemaS gefundener Sequenzen gehen aus Tabelle 2 

15 zusammenf assend hervor. 

Desaturasen ]<:6rm.en Cytochrom b5 Domanen aufweisen, die auch in 
anderen nicht Desaturasen codierenden Genen vorkommen. Cytochrom 
b5 Domanen zeigen mithin hohe Homologien an, obwohl es sich um 

20 verschiedene Genfunktionen handelt. Desaturasen konnen schwach. 
konservierter Bereiche lediglich als putative Kandidatengene 
identif iziert werden und mussen auf die Enzymaktivitat und 
Positionsspezif itat der enzymatischen Funktion hin gepruft 
werden- Beispielsweise zeigen auch verschiedene Hydroxylasen, 

25 Acetylenasen und Epoxygenasen ahnlich wie Desaturasen Histidin- 
Box Motive, so dass eine konkrete Funktion experimentell nach- 
gewiesen werden muS und zusatzlich die Verif izierung der Doppel- 
bindung erst eine sichere Enzymaktivitat und Positionsspezif itat 
einer Desaturase ermoglicht. Uberraschenderweise wurde gefunden, 

30 dass erf indungsgema£e A-6- und A-5- Desaturase besonders geeig- 
nete Substratspezif itaten aufweisen und besonders geeignet sind, 
•um in Kombination mit einer A-6-Elongase aus Physcomitrella zur 
Produktion von polyungesattigten Fettsauren wie Arachidonsaure, 
EicosapentaensS.ure und Docosahexaensaure genutzt werden konnen, 

35 

Die Sequenzierung des vollstandigen cDNA Fragmentes aus Klon 
PT001078032R ergab eine 1652 Basenpaare lange Sequenz. Die 
Sequenz codiert fur ein Polypeptid von 469 Aminosauren dar- 
gestellt in SEQ ID NO: 2. Diese wurde erhalten durch Uber- 

40 setzung des genetischen Codes aus SEQ ID NO: 1 mit einem Start-- 
codon in Basenpaarposition 115-117 und mit einem Stopcodon 
in Basenpaarposition 1522-1524. Der Klon beinhaltet ein voll- 
standiges Desaturase-Polypeptid, wie aus dem Sequenzvergleich 
in Figur 3 zu ersehen ist . Striche bedeuten identische Amino- 

45 sauren wahrend Doppelpunkte und Einzelpunkte chemisch aus- 
tauschbare, d.h. chemisch aquivalente Aminosauren darstellen. 
Der Vergleich wurde mit der BLOSUM62 Austauschmatrix fur Amino- 
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sauren nach Henikoff & Henikoff durchgefiihrt : ( (1992 ) Amino acid 
substitution matrices from protein blocks. Proc . Natl. Acad.Sci. 
USA 89: 10915-10919) . Verwendete Parameter: Gap Weight: 8; 
Average Match: 2 .912 , Length Weight : 2 , Average Mismatch: -2 . 003 . 

5 

In Figur 6 und Figur 7 ist der Vergleich der MA_desl2 Peptid- 
sequenz mit den gef undenen Sequenzen dargestellt . 

Die Sequenzierung des vollstandigen cDNA Fragmentes aus Klon 
10 PT0010070010R ergab eine in SEQ ID NO: 5 dargestellte 1651 Basen- 
paare lange Sequenz mit einem Startcodon in Position 67-69 und 
einem Stopcodon in Position 1552-1554. Die erf indungsgemaSe Poly- 
petidsequenz ist in SEQ ID NO: 6 dargestellt. 

15 Die Sequenzierung des vollstandigen identif izierten cDNA 

Fragmentes aus Klon PT0010072031R ergab eine in SEQ ID NO: 11 
dargestellte 1526 Basenpaare lange Sequenz mit einem Startcodon 
in Position 92-94 und einem Stopcodon in Position 1400-1402. 
Die erfindungsgemaiSe Polypetidsequenz ist in SEQ ID NO: 12 

20 dargestellt. 

In Tabelle 2 sind die Identitaten und Homologien erfindungs- 
gemaiSer Desaturasen untereinander und mit der Desaturase aus 
Physcomitrella patens und Mortierella alpina dargestellt- Die 

25 Angaben wurden mithilfe des Programms Bestfit unter gegebenen 
Parametern wie unten definiert als Teilprogramm f olgender Soft- 
ware erhalten: Wisconsin Package Version 10.0 (Genetics Computer 
Group (GCG) , Madison, Wise, USA). Henikoff, S. and Henikoff, 
J.G- (1992) . Amino acid substitution matrices from protein 

30 blocks. Proc. Natl. Acad. Sci . USA 89: 10915-10919. 

Weiterhin ist in Figur 5 der Vergleich der A-'6-acyl Lipid 
Desaturase aus Physcomitrella patens mit der Polypeptidsec[uenz 
des Klons Pt_des6 dargestellt. 

35 

Tabelle 2 : 



Homologie / 

Identitat in % 


Suchsequenz 
Pp_des 6 


Suchsequenz 
Ma_desl2 


Pt_des5 


34.92/26.37 


n.d. 


Pt_des6 


50.69/41.06 


n.d- 


Pt_desl2 


n.d. 


48.58/38.92 


Pt_desl2 .2 


n.d. 


48.37/41.60 



n.d. = nicht durchgefiihrt 
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Mithilfe des Algorhythmus TBLASTN 2.0.10: Altschul et al 1997, 
"Gapped BLAST and PSI-BLAST: a new generation of protein database 
search programs". Nucleic Acids Res. 25:3389-3402 wurden uber 
einen lokalen Datenbankvergleich Sequenzen mit hochster Sequenz- 
5 homologie bzw, Identitat identif iziert . Die Ergebnisse sind in 
folgender Tabelle 2A dargestellt. 

Tabelle 2A: Homologe mit den hochsten Sequenzhomologien bzw 

Identitaten zu erf indungsgemaSen Polypeptidsequenzen 



10 


aus SEQ ID NO- 


2, 4, 6 Oder 


12 






Homologie / 


Suchsequenz 


Suchsequenz 


Suchsequenz 


Suchsequenz 




Identitat (%) 


PT001070010R 


PT001072031R 


PT001078032R 


Pt_des6 


15 


L26296: Fad2 
A. thai i ana 


50 % / 37 % 


n.d- 


n.d. 


n.d. 




U86072 Petro- 












selinum 


n.d. 


51/40 


n.d. 


n.d. 




crispum Fad2 












AIi358652 










20 


Ii . ma j or 
putative 

desaturase 


n. d. 


n.d. 


45/30 


n.d. 




AB020032 M. 












alpina delta 


n.d. 


n.d. 


n.d. 


53/38 


25 


6 desaturase 











Beispiel 7 : Identif ikat ion von Genen mittels Hybridisierung 

Gensequenzen lassen sich zur Identif ikation homologer oder 
heterologer Gene aus cDNA- oder genomischen Banken verwenden. 

Homologe Gene (d.h, Voll-Langen-cDNA-Klone, die homolog sind, 
Oder Homologen) lassen sich uber Nukleinsaurehybridisierung 
unter Verwendung von beispielsweise cDNA-Banken isolieren: Ins- 
besondere zur Isolierung von funktionell aktiven Voll-Langengenen 
der in SEQ ID NO: 3 gezeigten kann die Methode genutzt warden. 
Je nach der Haufigkeit des Gens von Interesse werden 100000 bis 
zu 1000000 rekombinante Bakteriophagen plattiert und auf eine 
Nylonmembran uberftihrt. Nach der Denaturierung mit Alkali wurde 
die DNA auf der Membran z.B. durch UV-Vernetzung immobilisiert . 
Die Hybridisier\mg erfolgt bei hoch-stringenten Bedingungen. In 
wassriger Losung werden die Hybridisierung und die Waschschritte 
bei einer lonenstarke von 1 M NaCl und einer Temperatur von 68°C 
durchgef lihrt . Hybridisierungssonden wurden z.B. durch Markierung 
mittels radioaktiver (32p-.) Nicktranskription (High Prime, Roche, 
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Mannheim, Deutschland) hergestellt. Die Signale werden mittels 
Autoradiographie nachgewiesen . 

Partiell homologe oder heterologe Gene, die verwandt, aber nicht 
5 identisch sind, lassen sich analog zum oben beschriebenen Ver- 
fahren imter Veirwendung niedrig-stringenter Hybridisierungs- und 
Waschbedingungen identif izieren. Ftir die wassrige Hybridisierung 
wurde die lonenstarke gewohnlich bei 1 M NaCl gehalten, wobei 
die Temperatur nach und nach von 68 auf 42°C gesenkt wurde. 

10 

Die Isolierung von Gensequenzen, die nur zu einer einzelnen 
Domane von beispielsweise 10 bis 2 0 Aminosauren Homologien auf- 
weisen, lasst sich unter Verwendung synthetischer , radioaktiv 
markierter Oligonukleotidsonden durchftihren. Radioaktiv markierte 

15 Oligonukleotide werden mittels Phosphorylierung des 5'-Endes 

zweier komplementarer Oligonukleotide mit T4-Polynukleotidkinase 
hergestellt. Die komplementaren Oligonukleotide werden aneinander 
hybridisiert und ligiert, so dass Konkatemere entstehen. Die 
doppelstrangigen Konkatemere werden beispielsweise durch Nick- 

20 transkription radioaktiv markiert. Die Hybridisierung erfolgt 
gewohnlich bei niedrig-stringenten Bedingungen unter Verwendung 
hoher Oligonukleotidkonzentrationen . 

Oligonukleotid-HybridisierungslSsung: 

25 

6 X SSC 

0,01 M Natriumphosphat 
1 mM EDTA (pH 8) 
0,5 % SDS 

30 100 mikrog/ml denaturierte Lachssperma-DNA 
0,1 % fettarme Trockenmilch 

Wahrend der Hybridisierung wird die Temperatur schrittweise auf 5 
bis 10 °C unter die berechnete Oligonukleotid-Tm oder bis auf Raum- 

35 temperatur (bedeutet RT = ~ 23°C in alien Experimenten, wenn nicht 
anders angegeben) gesenkt, gefolgt von Waschschritten und Auto- 
radiographie . Das Waschen wird mit extrem niedriger Stringenz 
durchgefuhrt , zum Beispiel 3 Waschschritte unter Veirwendung von 
4 X SSC. Weitere Einzelheiten sind wie von Sambrook, J., et al. 

40 (1989), "Molecular Cloning: A Laboratory Manual", Cold Spring 
Harbor Laboratory Press, oder Ausubel, P.M., et al . (1994) 
"Current Protocols in Molecular Biology", John Wiley & Sons, 
beschrieben . 



45 
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Beispiel 8 : Identif ikation von Zielgenen durch Sichtung von 
Express ionsbanken mit Antikoirpern 

Es wurden cDNA-Sequenzen zur Herstellung von rekombinantem 
5 Protein ziom Beispiel in E. coli verwendet (z.B. Qiagen QIAexpress 
pQE-System) . Die rekombinanten Proteine wurden dann gewohnlich 
uber Ni-NTA-Af f initatschromatographie (Qiagen) affinitats- 
gereinigt . Die rekoiobinanten Proteine wurden dann zur Herstellung 
spezifischer Antikorper beispielsweise \mter Verwendung von 

10 Standardtechniken zur Immimisierung von Kaninchen verwendet. 
AnschlieiSend wurden die Antikorper dann unter Verwendung einer 
Ni-NTA~Saule, die mit rekombinantem Antigen vorgesattigt wird, 
af f initatsgereinigt , wie von Gu et al., (1994) BioTechniques 
17:257-262 beschrieben. Der Antikorper kann dann zur Durch- 

15 musterung von Expressions-cDNA-Banken mittels immunologischem 
Sichtung verwendet werden (Sambrook, J., et al . (1989), 
"Molecular Cloning: A Laboratory Manual", Cold Spring Harbor 
Laboratory Press, oder Ausubel, P.M., et al . (1994) "Current 
Protocols in Molecular Biology", John Wiley & Sons) . 

20 

Beispiel 9: Transformation von Agrobacterium 

Die AgrobacteriiiKi-vermittelte Pf lanzentransf ormation kann ziom 
Beispiel unter V^rvr&ndung des GVSlOl- (pMP90-) (Koncz und Schell, 
25 Mol. Gen. Genet. 204 (1986) 383-396) oder LBA4404- (Clontech) 
Oder C58C1 pGV2260 (Deblaere et al 1984, Nucl. Acids Res. 13, 
4777-4788) Agrobacterium tumef aciens-Stamms durchgefuhrt werden. 
Die Transformation kann durch Standard-Transf ormationstechniken 
durchgefuhrt werden (ebenfalls Deblaere et al. 1984) . 

30 

Beispiel 10: Pf lanzentransf ormation 

Die Agrobacterium- vermittelte Pf lanzentransf ormation kann unter 
Verwendung von Standard-Transformations- -und Regenerations- 

35 techniken durchgefuhrt werden (Gelvin, Stanton B., Schilperoort , 
Robert A., Plant Molecular Biology Manual, 2. Auf 1 . , Dordrecht: 
Kluwer Academic Publ . , 1995, in Sect., Ringbuc Zentrale Signatur: 
BTll-P ISBN 0-7923-2731-4; Glick, Bernard R. , Thompson, John E. , 
Methods in Plant Molecular Biology and Biotechnology, Boca Raton: 

40 CRC Press, 1993, 360 S., ISBN 0-8493-5164-2). 

Beispielsweise kann Raps mittels Kotyledonen- oder Hypokotyl- 
transformation transf ormiert werden (Moloney et al . , Plant 
Cell 8 (1989) 238-242; De Block et al . , Plant Physiol. 91 (1989) 
45 694-7 01) . Die Verwendung von Antibiotika fur die Agrobacterium- 
und Pf lanzenselektion' hangt von dem fur die Transformation 
verwendeten binaren Vektor und Agrobacterium-Stamm ab. Die 
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Rapsselektion wird gewohnlich unter Verwendung von Kanamycin 
als selektierbarem Pf lanzenmarker durchgef uhrt . 

Der Agrobacterium-ventiittelte Gentransfer in Lein (Lininn 
5 usitatissimiim) lasst sich irnter Veorwendiong von beispielsweise 
einer von Mlynarova et al . (1994) Plant Cell Report 13:282-285 
beschriebenen Technik durchfiihren. 

Die Transformation von Soja kann unter Verwend-ung von beispiels- 
10 weise einer in EP-A-0 0424 047 (Pioneer Hi-Bred International) 
Oder in EP-A-0 0397 687, US 5,376,543, US 5,169,770 (University 
Toledo) beschriebenen Technik durchgef lihrt werden. 

Die Pflanzentrans formation \inter Verwendung von Teilchen- 
15 beschuss, Polyethylenglycol-vermittelter DNA-Aufnahme oder 
liber die Siliziumcarbonatf aser-Technik ist beispielsweise be- 
schrieben von Freeling und Walbot "The maize handbook" (1993) 
ISBN 3-540-97826-7, Springer Verlag New York) . 

20 Beispiel 11: Plasmide fiir die Pf lanzentransf ormation 

Geeignete binare Vektoren und Trans format ionsmarker 

Zur Pf lanzentransformation kSnnen binare Vektoren, wie pBinAR 

(Hofgen und Willmitzer, Plant Science 66 (1990) 221-230) oder 

25 pGPTV (Becker et al . 1992, Plant Mol . Biol. 2 0:1195-1197) verwen- 
det werden. Die Konstruktion der binaren Vektoren kann durch Li- 
gation der cDNA in Sense- oder Antisense-Orientierung in T- 
DNA erfolgen. 5' der cDNA aktiviert ein Pf lanzenpromotor die 
Transkription der cDNA. Eine Polyadenylierungssequenz befindet 

30 sich 3' von der cDNA. Die binaren Vektoren konnen unterschiedli- 
che Markergene tragen. So kann etwa die Resistenz durch die Ex- 
pression des nptll Markergens unter Kontrolle des 35S oder des 
nos Promoters erfolgen. Insbesondere kann das npt I I -Marker gen co- 
dierend fur Kanamycin-Resistenz vermittelt durch Neomycinphospho- 

35 transferase gegen die herbizidresistente Form eines Acetolactat 
Synthasegens (AHAS oder ALS) ausgetauscht werden. Das ALS-Gen ist 
beschrieben in Ott et al., J. Mol. Biol. 1996, 263:359-3 60. Geei- 
gnet fiir manche Pflanzen ist auch die Verwendung des Hygromycin- 
Resistenz-Gens . Der v-ATPase-cl-Promotor kann in das Plasmid 

40 pBinl9 oder pGPTV kloniert werden und durch Klonierung vor die 
kodierende Region des ALS Gens fiir die Markergenexpression ge- 
nutzt werden. Der genannte v-ATPase-cl-Promotor entspricht einem 
1153 Has enpaar fragment aus Beta vulgaris (Plant Mol Biol, 1999, 
39:463-475). Der genannte nos Promoter Dabei konnen sowohl Sul- 

45 phonylharnstof f e als auch Imidazolinone wie Imazethapyr oder Sul- 
phonylharnstof f e als Antimetaboliten zur Selektion verwendet wer- 
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den. Alternativ kann auch der nos-Promoter fiir die Markergenex- 
pression verwendet werden, 

Beispiel 12 : Ermittlung von geeigneten Promotoren fur die 
5 Expression in Lein 

Die gewebespezif ische Expression lasst sich unter Verwendung ei- 
nes gewebespezif ischen Promotors erzielen. Beispielsweise kann 
die samenspez if ische Expression erreicht werden, indem der DC3~ 

10 Oder der LeB4- oder der USP-Promotor oder der Phaseolin-Promotor 
5' der cDNA einkloniert wird. Auch jedes andere samenspezif ische 
Promot or element wie z.B. der Napin- oder Arcelin Promoter (Goos- 
sens et al . 1999, Plant Phys . 120 (4) : 1095-1103 und Gerhardt et 
al. 2000, Biochimica et Biophysica Acta 1490 (1-2) :87-98) kann 

15 verwendet werden. Zur konstitutiven Expression in der ganzen 

Pflanzen lasst sich der CaMV-35S-Promotor oder ein v-ATPase-cl - 
Promoter verwenden. 

Urn die Eigenschaf ten des Promotors zu bestimmen und die essen- 
20 tiellen Elemente desselben, die seine Gewebespezif i tat ausmachen, 
zu identif izieren, ist es erf orderlich, den Promoter selbst oder 
verschiedene Fragmente desselben vor ein sogenanntes Reportergen 
zu setzen, das eine Bestimmung der Expressionsaktivitat ermog- 
licht. Beispielhaft fur ein Reportergen sei die bakterielle 
2S iS-Glucuronidase (GUS) genannt (Jefferson et al., EMBO J. 1987, 6, 
3901-3907) . Die S-Glucuronidase Aktivitat kann in-situ mittels 
eines chromogenen Substrates wie 5-Bromo-4-Chloro-3-Indolyl- 
S-D-Glucuronsaure im Rahmen einer Aktivitatsf arbung bestimmt wer- 
den (Jefferson, 1987, Plant Molecular Biology Reporter 5, 
30 387-405) . Fur die Untersuchungen der Gewebespezif itat wird das 
pflanzliche Gewebe geschnitten, eingebettet, gefarbt und analy- 
siert wie beschrieben (z.B. Baumlein H et al . , 1991 Mol Gen Genet 
225: 121-128) . 

35 Fluorimetrischer GUS-Test (nach Montgomery et al , , 1993) 

Dieser Assay erlaubt eine quantitative Bestimmung der GUS-Aktivi- 
tat in dem untersuchten Gewebe- Ftir die quantitative Aktivitats- 
bestimmung wird als Substrat ftir die b-Glucuronidase MQG (4-Me- 
40 thyl-umbellif eryl-beta-D-glucuronid) verwendet, das in MU (Me- 
thyl -umbelliferon) und Glucuronsaure gespalten wird. 

Dabei wird zunachst ein Proteinextrakt des gewiinschten Gewebe 
hergestellt, dem dann das Substrat der GUS zugesetzt wird. Das 
45 Substrat ist erst nach der Umsetzung durch GUS f luorimetrisch 
messbar. Zu verschiedenen Zeitpunkten werden Proben entnommen, 
die anschlieSend im Fluorimeter gemessen werden. Dieser Test 
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wurde mit LeinenLbryonen verscliiedener Altersstadien durchgeftihrt 
(21, 24 Oder 3 0 Tage nach Beginn der Bliite, daf = days after flo- 
wering) . Dazu wurde je ein Embryo in einem 2 inl-Reaktionsgef aS 
mit Hilfe einer Schwingmuhle (Retsch MM 2000) in flussigem Stick- 
5 stoff zu Pulver zerrieben. Nach Zugabe von 100 ml EGL-Puffer 
wurde fur 10 min bei 25C und 14000 x g zentrif ugiert . Der Uber- 
stand wurde abgenommen und ein zweites Mai zentrif ugiert . Wieder 
wurde der Uberstand in ein neues Reaktionsgef aS uberfuhrt und bis 
zur weiteren Verwendung auf Eis gehalten. Von diesem Proteinex- 

10 trakt wurden 25 ml mit 65 ml EGL-Puffer (ohne DTT) versetzt und 
fur den GUS-Assay eingesetzt. Nun wurden 10 ml des Substrates MUG 
(10 mM 4-Methyl-umbellif eryl-S-D-glucuronid) dazugegeben, gevor- 
text und sofort 3 0 ml als Nullwert entnommen und mit 470 ml 
Stopp-Puffer (0,2 M NaaCOa ) versetzt. Dieser Vorgang wurde fur 

15 alle Proben in einem Abstand von 3 0 s wiederholt. Die entnommenen 
Proben wurden bis zur Messung im Kiihlschrank gelagert . Weitere 
Messwerte wurden nach 1 h und nach 2 h entnommen. Fiir die Messung 
im Fluorimeter wurde eine Eichreihe erstellt, die Konzentrationen 
von 0,1 mM bis 10 mM MQ (4-Methyl-umbellif eron) enthielt . Waren 

20 die Probenwerte auSerhalb dieser Konzentrationen, wurde weniger 
Proteinextrakt eingesetzt (10 ml, 1 ml, 1 ml aus 1:10 Verdiin- 
nung) , und es wurden kurzere Zeitabstande gemessen (Oh, 3 0 min, 
1 h) . Die Messung erfolgte bei einer Exitation von 365 nm und ei- 
ner Emission von 445 nm in einem Fluoroscan Il-Gerat (Labsystem) . 

25 Alternativ kann die Substratspaltung Unter alkalischen Bedingun- 
gen f luorometrisch verfolgt werden (Anregung bei 3 65 nm, Messung 
der Emission bei 455 nm; SpectroFluorimeter BMG Polarstar+) wie 
beschrieben in Bustos M.M. et al., 1989 Plant Cell 1:839-853. 
Alle Proben wurden einer Proteinkonzentrationsbestimmung nach 

30 Bradford (197 6) unterzogen, um so eine Aussage iiber die Promote- 
raktivitat und -starke in verschiedenen Geweben und Pflanzen er~ 
lauben . 



EGL-Puffer 

35 0,1 M KPO4/ pH 7,8 

ImM EDTA 

5 % Glycerin 

1 M DTT 



40' Als weitere Beispiele fur Reportergene , die aquivalent benutzt 
werden konnen, seien beispielhaft das griin f lucres zierende Pro- 
tein (GFP) und dessen Derivate genannt (C.Reichel et al. (1996) 
Pr OG, Natl. Acad. Sci. USA 93, 5888-5893 und J. Sheen et al . , (1995) 
Plant Journal 8, 777-784) und verschiedene Luciferasen (A.Millar 

45 et al. (1992) Plant Mol. Biol. Reporter 10, 324-414). Die ent- 
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sprechenden Detektionsmethoden sind dem Fachmann bekannt xmd z.B. 
genannter Literatur beschrieben. 

Beispiele ftir Promoter-Reportergen-Konstrukte ftir oben genannte 
5 Promotoren sind im folgenden gegeben. Von diesen Promotoren kon- 
nen Fragmente mithilfe der Polymerasekettenreaktion isoliert und 
mit f lankierenden Sequenzen nach. Wah.1 auf Basis von syntbetiscben 
Oligonukleotiden maSgeschneidert werden. 

10 Folgende Oligonukleotide k6nnen beispielsweise veirwendet werden: 

IjeB4 vorne : GAAAGCTTCTCGAGTTATGCATTTCTT 
LeB4 hinten: GGGTCTAGATCTGTGACTGTGATAG 
DC3a vorne: AGTGGATCCCCGAGCTAACCACAACT 
15 DC3a hinten: ATAAGCTTTTTCTTTGCAGA 

napinvorne : GAAAGCTTCTAATATGATAAACTCTG 
napinhinten : GGGTCTAGAAACACATACAAACATCAC 

Die Methoden sind dem Fachmann auf dem Gebiet bekannt und sind 
20 allgemein literaturbekannt . 

In einem ersten Schritt werden die Promotorf ragmente iiber PGR am- 
plifiziert, mit geeigneten Restriktionsenzymen geschnitten und in 
die obigen Kassetten einkloniert. Beispielsweise wird das 

25 LeB4 (700) -PCR-Fragment mit Xbal und Hindlll geschnitten und in 
den Vektor pGPTV in die Hindlll und Xbal-Schnittstellen 5 ' vor 
dem GUS Reportergen kloniert. Das PCR-amplif izierte DC3-Promoter- 
fragment kann mit BamHI und Hindlll geschnitten, z,B. in pBlues- 
cript (Stratagene)* subkloniert und dann in pGPTV in geeignete 

30 Schnittstellen vor das GUS-Reportergen kloniert werden. 

Beispielsweise kann ein mit obigen Primern PCR-amplif iziertes na- 
pin-Promotorf ragment mit einer Grofie von lQ55bp nach Verdau mit 
Hindlll und Xbal in pGPTV vor das GUS Reportergen einkloniert 
35 werden. Ein aquivalentes Konstrukt konnte ein Napin-Promoter frag- 
ment von llOObp 5 '-kloniert vor ein GUS Reportergen mit Intron 
mit in 3 ^ Richtung nachf olgendem Nos-Terminator in einem 
pHIi9000-Vektor (Hausmann & Topfer, 1999) sein. 

40 Unter Verwendung von oben beschriebenen oder aquivalenten Kon- 
strukten nach Transformation in Lein der Sorte Flanders, laSt 
sich die GUS-Aktivitat in transgenen Leinembryonen verschiedener 
Altersstadien messen, die mit einem der folgenden Konstrukte 
transformiert wurden: Napin-GUS, 35S-GUS, LeB4-GUS, USP-GUS. Die 

45 Werte sind Mittelwerte aus ein bis fiinf Messungen mit verschiede- 
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nen Proteinmengen. Pro Konstrukt warden je drei Embryonen qiianti- 
tativ analysiert. 

In der qijantitativen Analyse ergaben sich grofie Unterschiede zwi- 
5 schen den verschiedenen samenspezif ischen Promotoren. Der Napin 
Promotor aus Brass ica napus earwies sich. als um zwei bis drei 
Zehnerpotenzen weniger aktiv als die beiden Promotoren aus Vicia 
faba (LeB4 und USP) . Die GUS-Aktivitat nahm in der Reihenfolge 
Napin, LeB4 und USP zu. Die Positivkontrolle 35S bewegte sich in 
10 ihrer Aktivitat zwischen LeB4 und USP, wohingegen die Negativkon- 
trolle, der nicht trans fonaierte Wildtyp (Sorte Flanders), so gut 
wie keine Aktivitat besa£. Die folgende Tabelle gibt die Mittel- 
werte der Aktivitaten in den einzelnen Altersstadien sowie gesamt 
fur jedes Konstrukt wieder. 

15 

Tabelle 3-4: IJbersicht iiber die mittleren GUS-Aktivitaten von 
Leinembryonen, transf ormiert mit verschiedenen GUS-Konstrukten. 
daf : Tage nach Beginn der Bliite. 

20 Mit * markiert wurden Werte, die nur einer Messung zugrundelie- 
gen. 



25 



GUS- 


GUS- 


-Aktivi- 


GUS-Aktivitat 


GUS- 


-Aktivitat 


GUS- 


-Aktivitat 


% vs. 


Konstrukt 


tat 


[nmol/ 


[nmoVh/mg Pro- 


[nmol/h/mg Pro- 


[mnol/h/mg Pro- 


35S 




h/mg Protein] 


tein] 




tein] 




tein} 








Mittelwert 21 


Mittelwert 24 daf 


Mittelwert 30 daf 


Gesamtmittelwert 






daf 


















Ohne 




0,06 




0,06 




*0,02 




0,05 


0,0007 


35S 




649,00 




913,00 




639,00 




734,00 


100,00 


Napin 




7,70 




■ 5,70 




3,70 




5,70 


0,80 


LeB4 




1778,00 




253,00 




283,00 




771,00 


105,00 


USP 




2843,00 




3770,00 




2107,00 




2907,00 


396,00 



35 



Beispiel 13 : Plasmide fur die Pf lanzentransf ormation 

Zur Pf lanzentransf ormation konnen binare Vektoren, wie pBinAR 
(Hofgen und Willmitzer, Plant Science 66 (1990) 221-230) oder 
pGPTV (Becker et al 1992, Plant Mol. Biol- 20:1195-1197) oder 
Derivate davon verwendet werden. Die Konstruktion der binaren 
Vektoren kann durch Ligation der cDNA in Sense- oder Antisense- 
Orientierung in T-DNA erfolgen. 5' der cDNA aktiviert ein 
Pf lanzenpromotor die Transkription der cDNA. Eine Polyadenylie- 
rungssequenz befindet sich 3' von der cDNA. Die binaren Vektoren 
konnen unfcerschiedliche Markergene tragen. Insbesondere kann das 
npt 1 1 -Marker gen codierend ftir Kanamycin-Resistenz vermittelt 
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durch Neomycinphosphotransf erase gegen die herbizidresistente 
Form eines Acetolactat Synthasegens (Abkiirzung : AHAS Oder ALS) 
ausgetauscht werden. Das ALS-Gen ist beschrieben in Ott et al . , 
J. Mol. Biol. 1996, 263:359-350. Der v-ATPase-cl-Promotor kann in 
5 das Plasmid pBinl9 oder pGPTV kloniert werden und durch Klonie- 
rung vor das ALS Codierregion fiir die Markergenexpression genutzt 
werden. Der genannte Promotor entspricht einem 1153 Basenpaar- 
fragment aus beta-Vulgaris (Plant Mol Biol, 1999, 39:463-475). 
Dabei konnen sowohl Sulphonylharnstof f e als auch Imidazolinone 
10 wie Imazethapyr oder Sulphonylharnstof fe als Antiiuetaboliten zur 
Selektion verwendet werden. 

Die gewebespezif ische Expression lasst sich unter Verwendung 
eines gewebespezif ischen Promotors erzielen. Beispielsweise kann 

15 die samenspez if ische Expression erreicht werden, indem der DC3- 
oder der LeB4- oder der USP-Promotor oder der Phaseolin-Promotor 
5' der cDNA einkloniert wird. Auch jedes andere samenspezif ische 
Promotorelement wie z.B. der Napin- oder Arcelin Promotor 
Goossens et al . 1999, Plant Phys . 120 ( 4) : 1095-1103 und Gerhardt 

20 et al. 2000, Biochimica et Biophysica Acta 1490 (1-2 ): 87-98) kann 
verTrt^endet werden. Zur konstitutiven Expression in der ganzen 
Pflanzen l^sst sich der CaW-SSS-Promotor oder ein v-ATPase CI 
Promotor verwenden. 

25 Insbesondere lassen sich Gene codierend fur Desaturasen xmd 
Elongasen durch Konstruktion mehrerer Expressionskassetten 
hintereinander in einen binaren Vektor klonieren, um den 
Stof fwechselweg in Pflanzen nachzubilden. 

30 Innerhalb einer Expressionskassette kann das zu exprimierende 

Protein unter Verwendung eines Signalpeptids, beispielsweise fur 
Plastiden, Mitochondrien oder das Endoplasmat ische Retikulum, in 
ein zellulares Kompartiment dirigiert werden (Kermode, Grit. Rev. 
Plant Sci. 15, 4 (1996) 285-423). Das Signalpeptid wird 5' im 

35 Leseraster itiit der cDNA einkloniert, um die subzellulare Lokali- 
sierung des Fusionsprotein zu erreichen. 

Beispiele fiir Multiexpressionskassetten sind im folgenden 
gegeben , 

40 

I . ) Promotor-Terminator-Kassetten 

Expressionskassetten bestehen aus wenigstens zwei fimktionellen 
Einheiten wie einem Promotor und einem Teinninator. Zwischen 
45 Promotor und Terminator konnen weitere gewCinschte Gensequenzen 
wie Targetting-Sequenizen, Codierregionen von Genen oder Teilen 
davon etc. eingefugt werden. Zuca Aufbau von Expressionskassetten 
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werden Promotoren ixnd Terminatoren (USP Promotor: Baeimilein 
et al., Mol Gen Genet, 1991, 225 (3):459-67); OCS Terminator: 
Gielen et al. EMBO J. 3 (1984) 835ff,) mithilfe der Polymerase- 
]^ettenreaktion isoliert und mit f lankierenden Sequenzen nach Wahl 
5 auf Basis von syntiietischen Oligonukleotiden maSgeschneidert . 

Folgende Oligonukleotide konnen beispielsweise verwendet werden: 
USPl vorne : CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
USP2 vorne : CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
10 USP3 vorne : CCGGAATTCGGCGCGCCGAGCTCCTCGAGCAAATTTACACATTGCCA 
USPl hinten : AAAACTGCAGGCGGCCGCCCACCGCGGTGGGCTGGCTATGAAGAAATT 
USP2 hinten : CGCGGATCCGCTGGCTATGAAGAAATT 

USP3 hinten : TCCCCCGGGATCGATGCCGGCAGATCTGCTGGCTATGAAGAAATT 
OCSl vorne: AAAACTGCAGTCTAGAAGGCCTCCTGCTTTAATGAGATAT , 
15 0CS2 vorne : CGCGGATCCGATATCGGGCCCGCTAGCGTTAACCCTGCTTTAATGAGATAT 
0CS3 vorne: TCCCCCGGGCCATGGCCTGCTTTAATGAGATAT 

OCSl hinten : CCCAAGCTTGGCGCGCCGAGCTCGAATTCGTCGACGGACAATCAGTAAATTGA 
OCS2 hinten : CCCAAGCTTGGCGCGCCGAGCTCGAATTCGTCGACGGACAATCAGTAAATTGA 
0CS3 hinten : CCCAAGCTTGGCGCGCCGAGCTCGTCGACGGACAATCAGTAAATTGA 

20 

Die Methoden sind dem Fachmann auf dem Gebiet bekannt und sind 
allgemein literaturbekannt . 

In einem ersten Schritt werden ein Promotor und ein Terminator 
25 liber PGR amplif iziert . Dann wird der Terminator in ein Empfanger- 
plasmid kloniert und in einem zweiten Schritt der Promotor vor 
den Teorminator inseriert. Mi thin erhalt man eine Expressions- 
kassette auf einem Tragerplasmid. Auf Basis des Plamides pUCl9 
werden die Plasmide pUTl, pUT2 und pUT3 erstellt. 

30 

Die Konstrukte sind erf indxingsgemaS in SEQ ID NO: 13, 14 und 15 
definiert. Sie enthalten auf Basis von pUCl9 den USP-Promotor und 
den OCS Terminator. Auf Basis dieser Plasmide wird das Konstrukt 
pUTl2 erstellt, indem pUTl mittels Sall/Scal geschnitten wird und 

35 pUT2 mittels Xhol/Scal geschnitten wird. Die die Expressions- 
kassetten enthaltenden Fragmente werden ligiert und in E. coli 
XLI blue MRF transf ozitiiert . Es wird nach Vereinzelung ampicillin- 
resistenter Kolonien DNA prapariert und per Restriktionsanalyse 
solche Klone identif iziert , die zwei Expressionskassetten ent- 

40 halten. Die Xhol/Sall Ligation kompatibler Enden hat dabei die 
beiden Schnittstellen Xhol "und Sail zwischen den Expressions- 
kassetten eliminiert. Es resultiert das Plasmid pUTl2, das in 
SEQ ID NO: 16 definiert ist. AnschlieEend wird pUTl2 wiederum 
mittels Sal/Scal geschnitten und pUT3 mittels XhoI/Scal ge- 

'45 schnitten. Die die Expressionskassetten enthaltenden Fragmente 

werden ligiert und in'E, coli XLI blue MRF transf ormiert . Es wird 
nach Vereinzelung ampicillinresistenter Kolonien DNA prapariert 
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und per Restriktionsanalyse solche Klone identif iziert , die drei 
Expressionskassetten enthalten. Auf diese Weise wird ein Set von 
Multiexpressionskassetten geschaffen, dass fur die Insertion ge- 
wiinschter DNA genutzt werden kann und in Tabelle 3 beschrieben 
5 wird und zudem noch. weitere Expressionskassetten aufnehmen kann. 

Diese enthalten folgende Elemente: 

Tabelle 3 



20 



pUC19- 
Derivat 


Schnittstellen vor dem 
USP Promotor 


Multiple 
Klonierungs-Schnittstellen 


Schnittstellen hinter dem 

OCS-Tenninator 


pUTl 


EcoRI/AscI/ Sacl/Xhol 


BstXI/NotI/ Pstl/Xbal/StuI 


Sall/EcoRI/ SacI/AscI/ 
Hindffl 


pUT2 


EcoRI/AscI/ Sacl/Xhol 


BamHI/EcoRV/ Apal/Nhel/ Hpal 


Sall/EcoRI/ SacI/AscI/ 
Hindni 


pUT3 


EcoRI/AscI/ Sacl/Xhol 


BgHI/Nael/ Clal/Smal/Ncol 


Sall/SacI/ Ascl/Hindin 


pUT12 

Doppel-expres- 
sionskassette 


EcoRI/AscV Sacl/Xhol 


BstXI/NotI/ Pstl/Xbal/StuI 
Und 

BamHI/EcoRV/ Apal/Nhel/ Hpal 


Sall/EcoRI/ SacI/AscI/ 
Hindffl 


pUT123 

Tripel-expres- 

sionskassette 


EcoRI/Ascy Sacl/Xhol 


1 .BstXI/NotI/ Psti/Xbal/StuI 
und 

2. BainHI/EcoRV/ Apal/Nhel/ 
Hpal 

und 

3. BglII/NaeI/ Clal/Smal/NcoI 


Sall/Sacl/Ascl/Hindlll 



Weiterhin lassen sich wie beschrieben und wie in Tabelle 4 naher 
spezifiziert weitere Multiexpressionskassetten mithilfe des 

30 i) USP-Promotors oder mithilfe des 

ii) ca. 700 Basenpaare 3 ' -Fragmentes des LeB4-Proiaotors oder 
mithilfe des 

iii) DC3-Promotors erzeugen und fur samenspezif ische Genexpression 
einsetzen. 

35 

Der DC3-Promotor ist beschrieben bei Thomas, Plant Cell 1996, 
263:359-368 und besteht lediglich aus der Region -117 bis +27 
weshalb er mithin einer der kleinsten bekannten samenspezif ischen 
Promotoren darstellt. 

40 

Von diesen Promotoren konnen Fragmente mithilfe der Polymerase- 
kettenreaktion isoliert und mit f lankierenden Sequenzen nach Wahl 
auf Basis von synthetischen Oligonukleotiden maSgeschneidert wer- 
den. 

45 

Folgende Oligonukleotide konnen beispielsweise veirwendet werden: 
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LeB4 vorne: GAAAGCTTCTCGAGTTATGCATTTCTT 
LeB4 hinten: GGGTCTAGATCTGTGACTGTGATAG 
DC3a vorne: CCGGAATTCGGCGCGCCGAGCTCCTCGAG 
DC3a hinten: CGCGGATCCTAGCTTTTTCTTGGCAGATG 

5 

Die Meth-oden sind dem Fachmann auf dem Gebiet bekannt und sind 
allgemein literaturbekannt . 

In einem ersten Schritt werden die Promotorf raginente iiber PGR aia- 
10 plifiziert, mit geeigneten Restriktionsenzymen geschnitten iind in 
die obigen Kassetten einkloniert. Beispielsweise wird das 
LeB4 (700) -PCR-Fragment mit Xhol \xnd Bglll geschnitten iind in die 
Xhol iznd Bglll-Schnittstellen des Plasmids pUT3 eingesetzt, uin 
pIjT3 zu erhalten. 

15 

Vorteilhafte Expressionskassetten enthalten auf Basis von pUCl9 
(Vieira und Messing (1982); Gene 19, 259), die SEQ ID NO: 32, den 
LeB4-Proniotor und die Sequenzen SEQ ID NO: 33, SEQ ID NO: 34 oder 
SEQ ID NO: 35. Auf Basis dieser Plasmide wird das Konstrukt pIiTl2 

20 erstellt, indem pUTl mittels Sall/Scal geschnitten wird und pUT2 
mittels Xhol/Scal geschnitten wird. Die die Expressionskassetten 
enthaltenden Fragmente werden ligiert und in E. coli XLI blue MRF 
trans formiert . Es wird nach Vereinzelung Ampicillin-resistenter 
Kolonien DNA prapariert und per Restriktionsanalyse solche Klone 

25 identif iziert, die zwei Expressionskassetten enthalten. Die Xhol/ 
Sail Ligation kompatibler Enden hat dabei die beiden Schnittstel- 
len Xhol und Sail zwischen den Expressionskassetten eliminiert. 
Es resultiert das Plasmid pUTl2, das in SEQ ID NO: 16 definiert 
ist. AnschlieSend wird pUT12 wiederum mittels Sal/Scal geschnit- 

30 ten und pUT3 mittels XhoI/Scal geschnitten. Die die Expressions- 
kassetten enthaltenden Fragmente werden ligiert und in E. coli 
Xlil blue MRF transf oinuiert . Es wird nach Vereinzelung Ampicillin- 
resistenter Kolonien DNA prapariert und per Restriktionsanalyse 
solche Klone identif iziert , die drei Expressionskassetten enthal- 

35 ten. Auf diese Weise wird eine Auswahl von Multiexpressionskas- 
setten geschaffen, die fiir die Insertion gewunschter DNA genutzt 
werden kann und in Tabelle 3 beschrieben wird und zudem noch wei- 
tere Expressionskassetten aufnehmen kann. 

40 Die Expressionskassetten konnen mehrfach den selben Promoter ent- 
halten Oder aber tiber drei Verschiedene Promotoren aufgebaut wer- 
den. 
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Tabelle 4 : Multiple Expressionskassetten 





Plasmidname des 


Schnittstellen vor dem 


Multiple 


Schnittstellen hinter 




pUC19-Derivates 


jeweiligen Promotor 


Klonierungs-Schnittstellen 


dem OCS-Tenninator 


5 


pU 1 i 

(pUC19mit 


EcoRI/AscI/SacI/XhoI 


(1) BstXI/Notl/PstI/ Xbal/StuI 


Sall/EcoRI/SacI/AscI/ 
Hindin 




USP-OCSl) 








pJDCl 

(pUC19 mit 


xicoxQ/ ASCI/ oaci/ AnOi 


(2) BamHI/EcoRV/ Apal/Nhel/ 
Hpal 


Sall/EcoRI/SacI/AscI/ 
Hindin 




DC3--OCS) 




10 


pLeBT 

(pUC19-mit 

LeB4(700)-OCS) 


EcoRI/AscI/SacI/XhoI 


(3) Bgin/Nael/ Clal/Smal/Ncol 


Sall/Sacl/Ascl/Hindni 


15 


pUD12 

(nJlC 1 Q mit mit 

\L/ \J 1 7 1X1 J. L 1111 L 

USP-OCSl undmit 


EcoRI/AscI/SacI/XhoI 


(1) BstXimotI/ Pstl/Xbal/StuI 
und 

(2) BamHI/EcoRV/ Apal/Nhel/ 


Sall/EcoRI/SacI/AscI/ 
Hindin 


DC3-0CS) 




Hpal 






pUDLi23 
Triple expression 




(1) BstXI/Notl/Pstl/Xbal/StuI 
xmd 


Sall/Sacl/Ascl/Hindin 


20 


cassette 

(pUC19mitUSP/ 
DCS und 
LeB4-700) 


EcoRI/AscI/SacI/XhoI 


(2) BarnHV (EcoRV*)/ApaI/ 
Nhel/Hpal und 

(3) Bglll/Nael/ Clal/Smal/NcoI 





* EcoRV Schnitts telle schneidet im 700 Basenpaar fragment des LeB4 
Pr omotors ( LeB4-7 0 0 ) 

25 

Analog lassen sich weitere Promotoren fiir Multigenkonstrukte 
erzeugen insbesondere unter Verwendung des 

a) 2,4 kB Fragmentes des LeB4-Proitiotors (Baumlein et al., 1991: 
30 Mol . Gen . Genet . 225,121-128) oder mithilfe des 

b) Phaseolin-Promotors (Bustos et al . (1989) Plant Cell 
1,839-853) Oder mithilfe des 

3^ c) konstitutiven v-ATPase cl-Promotors . 

Es kann insbesondere wunschenswert sein, weitere besonders geei- 
gnete Promotoren zuru Aufbau samenspezif ischer Multiexpressions- 
kassetten wie z.B. eines der Fragmente des Napin- Promoters (Stal- 
^0 berg et al . , 1993: Plant Mol .Biol . 23 , 671-683 ) oder den Arcelin-5 
Promotor (A.Goossens et al.", 1999: plant Physiol. 120,1095-1104) 
zu verwenden. 
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ii) Erstelliing von Expressionskonstrukten in pUC19- oder pGPTV 
Derivaten, die Promotor und Terminator erhalten und in 
Kombination mit gewiinschten Gensequenzen zur PUFA Gen- 
expression in pflanzlichen Expressionskassetten enthalten. 

5 

Multiexpressionskassetten k5nnen mittels AscI direkt von 
pUC19-Derivaten aus Tabelle 3 in den Vektor pGPTV+AscI (siehe 
iii . ) ) <iber die AscI Schnittstelle inseriert werden und stehen 
zur Inserierung von Zielgenen zur Verfiigung. Die entsprechenden 

10 Genkonstrukte (pBUTl ist in SEQUENZ ID NO: 20, pBUT2 ist in 
SEQUENZ ID NO: 21, pBUT 3 ist in SEQUENZ ID NO: 22, pBUTl2 
ist in SEQUENZ ID NO: 22 und pBUTl23 ist in SEQUENZ ID NO: 24 
dargestellt) stehen erf indunsgemaS als Kit zur Verfiigung, 
Alternativ konnen Gensequenzen in die pUC19 basierten 

15 Expressionskassetten inseriert werden und als AscI Fragment 
in pGPTV+AscI eingesetzt werden. 

In pUTl2 wird zunachst izber BstXI und Xbal die D-6-Elongase 
Pp_PSEl in die erste Kassette inseriert. Dann wird die 

20 D-6-Desaturase aus Moos (Pp_des5) liber BamHI/Nael in die 

zweite Kassette inseriert. Es entsteht das Konstrukt pUT-ED.Das 
AscI Fragment aus dem Plasmid pUT-ED wird in den mit AscI ge- 
schnittenen Vektor pGPTV+AscI inseriert und die Orientierung des 
inserierten Fragmentes mittels Restriktion oder Sequenzierung 

25 ermittelt. Es entsteht das Plasmid pB-DHGLA, dessen vollstandige 
Secjuenz in SEQUENZ ID NO. 25 dargestellt ist. Die Codierregion 
der Physcomitrella delta 6 Elongase ist in SEQUENZ ID NO. 2 6 
dargestellt, die der delta 6 Desaturase aus Physcomitrella in 
SEQUENZ ID NO: 27. 

30 

In pUTl23 wird zunachst liber BstXI und Xbal die A-6-Elongase 
Pp_PSEl in die erste Kassette inseriert. Dann wird die 
A-6-Desaturase aus Moos {Pp_des6) uber BamHI/Nael in die 
zweite Kassette inseriert und schlieSlich die A-5 -Desaturase 
35 aus Phaeodactylum (Pt_des5) tiber Bglll in die dritte Kassette 
inseriert. Das Dreif achkonstrukt erhalt den Namen pARAl. Unter 
Berucksichtigung sequenzspezif ischer Restriktionsschnittstellen 
kdnnen weitere Expressionskassetten gemalS Tabelle 5 mit der 
Bezeichnung pARA2 , pARA3 und pARA4 erstellt werden. 

40 

Das AscI Fragment aus dem Plasmid pARAl wird in den mit AscI 
geschnittenen Vektor pGPTV+AscI inseriert und die Orientierung 
des inserierten Fragmentes mittels Restriktion oder Sequenzierxing 
ermittelt. Die vollstandige Sequenz des resultierenden Plasmides 
45 pBARAl ist in SEQUENZ ID NO. 28 dargestellt. Die Codierregion 
der Physcomitrella delta 6 Elongase ist in SEQUENZ ID NO. 29 
dargestellt, die der delta 6 Desaturase aus Physcomitrella 
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in SEQUENZ ID NO: 3 0 und die der delta-5 Desaturase aus 
Phaeodactylum tricornutim in SEQUENZ ID NO: 31. 



Tabelle 5 : Kombinationen von Desaturasen xind Elongasen 



5 





Gen 
Plasmid 


A-6-Desaturase 


A-5-Desaturase 


A-6-Elongase 


1 


PUT-ED 


Pp_des6 




Pp_PSEl 


2 


pARAl 


Pt_des6 


Pt_des5 


Pp^PSEl 


3 


pARA2 


Pt_des6 


Ce_des5 


PpJPSEl 


4 


pARA3 


Pt_des6 


Ce_des5 


PpJPSEl 


5 


pARA4 


Ce_des6 


Ce_des5 


Ce^PSEl 


6 


PBDHGLA 


PL.des6 




Pp_PSEl 


7 


PBARAI 


Pt_des6 


Pt_des5 


PpJPSEl 



Plasmide 1 bis 5 sind pUC Derivate, Plasmide 6 bis 7 sind binare 
Pf lanzentransf oinmationsvektoren 



20 



25 



Pp = Physcomitrella patens, Pt = Phaeodactylum tricornutum 
Pp_PSEl entspricht der Sequenz aus SEQ ID NO: 9- 
PSE = PUFA spezifische A-6-Elongase 

Ce_des5 = A-5 -Desaturase aus Caenorhabditis elegans (Genbank Acc . 
Nr. AF078796) 

Ce_des6 = A- 6 -Desaturase aus Caenorhabditis elegans elegans 
(Genbank Acc. Nr. AF031477, Basen 11-13 42) 

Ce_PSEl = A--6-Elongase aus Caenorhabditis elegans (Genbank Acc. 
Nr. AF244356, Basen 1-867) 



Auch weitere Desaturasen oder Elongasegensequenzen konnen in 
Expressionskassetten beschriebener Art inseriert werden wie 
z.B. Genbank Acc. Nr. AF231981, NM_013402, AF206662, AF268031, 
AF226273, AF110510 oder AF110509. 



35 



iii) Transfer von Expressionskassetten in Vektoren zur 

Trans fontiHt ion von Agrobakterium tiimef aciens und zur 
Trans format ion von Pflanzen 



Chimare Genkonstrukte auf Basis der in pUC19 beschriebenen konnen 
mittels AscI in den binaren Vektor pGPTV inseriert. Die multiple 
Klonierungssequenz wird zu diesem Zweck um eine AscI Schnitt- 
stelle erweitert. Zu diesem Zweck wird der Polylinker als zwei 
doppelstrangige Oligonukleotide neu synthetisiert , wobei eine zu- 
satzliche AscI DNA Sequenz eingefugt wird. Das Oligonukleotid 
wird mittels EcoRI und Hindlll in den Vektor pGPTV inseriert. Es 
entsteht das Plasmid pGPTV+AscI. Die notwendigen Kloniertechniken 
sind dem Fachmann bekannt iind konnen einfach wie in Beispiel 1 
beschrieben nachgelesen werden. 



wo 02/057464 



PCT/EP02/00461 



99 

Beispiel 14: In vivo-Mutagenese 

Die in vivo-Mutagenese von Mikroorganismen kann mittels Passage 
der Plasmid- (oder einer anderen Vektor-) DNA durch E. coli 
5 Oder andere Mikroorganismen (z.B. Bacillus spp. oder Hefen, 
wie Saccharomyces cerevisiae) , bei denen die Fahigkeiten, die 
Unversehrtheit ihrer genetischen Information auf rechtzuerhalten, 
gestort ist, erfolgen. Ubliche Mutator-Stamme haben Mutationen in 
den Genen fiir das DNA-Reparatursystem (z.B. mutHLS, mutD, mutT 

10 usw.; als Literaturstelle siehe Rupp, W.D. (1996) DNA repair 
mechanisms, in: Escherichia coli and Salmonella, S. 2277-2294, 
ASM: Washington) . Diese StSmme sind dem Fachmann bekannt. Die 
Verwendung dieser Stamme ist beispielsweise in Greener, A. , und 
Callahan, M. (1994) Strategies 7:32-34, erlautert. Der Transfer 

15 mutierter DNA-Molektile in Pflanzen erfolgt vorzugsweise nach 

Selektion und Test der Mikrooganismen. Transgene Pflanzen werden 
nach verschiedenen Beispielen im Beispielteil dieses Dokumentes 
erzeugt . 

20 Beispiel 15: Untersuchung der Expression eines rekombinanten 

Genproduktes in einem trans formiert en Organismus 

Die Aktivitat eines rekombinanten Genproduktes im trans formiert en 
Wirtsorganismus kann auf der Transkriptions- und/ oder der 
25 Trans la tionsebene gemessen werden. 

Ein geeignetes Verfahren zur Bestimmung der Menge an 
Transkription des Gens (ein Hinweis auf die Menge an RNA, 
die fur die Translation des Genproduktes zur Verfiigung steht) 

30 ist die Durchftihrung eines Northern-Blots wie unten ausgefuhrt 
(als Bezugsstelle siehe Ausubel et al. (1988) Current Protocols 
in Molecular Biology, Wiley: New York, oder den oben erwahnten 
Beispielteil) , wobei ein Primer, der so gestaltet ist, dass 
er an das Gen von Interesse bindet, mit einer nachweisbaren 

35 Markierung (gewohnlich radioaktiv oder chemiliimineszent ) markiert 
wird, so dass, wenn die Gesamt-RNA einer Kultur des Organismus 
extrahiert, auf einem Gel aufgetrennt, auf eine stabile Matrix 
transferiert und mit dieser Sonde inkubiert wird, die Bindung und 
das Ausmail* der Bind\ing der Sonde das Vorliegen und auch die Menge 

40 der mRNA fur dieses Gen anzeigt. Diese Information zeigt den 
Grad der Transkription des 'trans formiert en Gens an. Zellulare 
Gesamt-RNA kann aus Zellen, Geweben oder Organen mit mehreren 
Verfahren, die alle im Fachgebiet bekannt sind, wie zum Beispiel 
das von Bormann, E.R., et al. (1992) Mol. Microbiol. 6:317-326 

45 beschriebene, prapariert werden. 
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Northern-Hybridisierung 

Fiir die RNA-Hybridisierung warden 2 0 [xg Gesamt-RNA oder 1 |xg 
poly(A)+~RNA mittels Gelelektrophorese in Agarosegelen mit 
5 einer Starke von 1,25 % unter Verwendung von Formaldehyd, wie 
beschrieben in Amasino (1986, Anal. Biochem. 152, 304) auf- 
getrennt, mittels Kapillaranziehxing unter Verwendung von 10 x 
BSC auf positiv geladene Nylonmembranen (Hybond N+ , Aitiersham, 
Braunschweig) ubertragen, mittels UV-Licht immobilisiert und 

10 3 Stunden bei 68°C unter Verwendung von Hybridisierungspuf f er 

(10 % Dextransulfat Gew./Vol., 1 M NaCl, 1 % SDS, 100 mg Herings- 
sperma-DNA) vorhybridisiert . Die Markierung der DNA-Sonde mit 
dem Highprime DNA labeling~Kit (Roche, Mannheim, Deutschland) 
erfolgte wahrend der Vorhybridisierung unter Verwendung von 

15 alpha-^^p-^-dcTP (Amersham, Braimschweig, Deutschland) . Die Hybridi- 
sierung wurde nach Zugabe der markierten DNA-Sonde im gleichen 
Puffer bei 68°C uber Nacht durchgefuhrt . Die Waschschritte wurden 
zweimal fiir 15 min unter Verwendung von 2 X SSC und zweimal fur 
30 min unter Verwendung von 1 X SSC, 1 % SDS, bei 68°C durch- 

20 gefuhrt. Die Exposition der verschlossenen Filter wurde bei -70°C 
fur einen Zeitraum von 1 bis 14 T durchgefuhrt. 

Zur Untersuchung des Vorliegens oder der relativen Menge an von 
dieser mRNA translatiertem Protein konnen Standardtechniken, wie 

25 ein Western-Blot, eingesetzt werden (siehe beispielsweise Ausubel 
et al. (1988) Current Protocols in Molecular Biology, Wiley: 
New York) . Bei diesem Verfahren werden die zellularen Gesamt- 
Proteine extrahiert, mittels Gelelektrophorese aufgetrennt, 
auf eine Matrix, wie Nitrozellulose, iibertragen und mit einer 

30 Sonde, wie einem Antikorper, der spezifisch an das gewunschte 
Protein bindet, inkubiert. Diese Sonde ist gewohnlich mit einer 
chemilumineszenten oder kolorimetrischen Markierung versehen, 
die sich leicht nachweisen lasst. Das Vorliegen und die Menge 
der beobachteten Markierung zeigt das Vorliegen und die Menge des 

35 gewtinschten, in der Zelle vorliegenden mutierten Proteins an. 

Beispiel 16: Analyse der Auswirkung der rekombinanten Proteine 
auf die Produktion des gewiinschten Produktes 

40 Die Auswirkung der genetischen Modifikation in Pflanzen, Pilzen, 
Algen, Ciliaten oder auf die Produktion einer gewtinschten Ver- 
bindung (wie einer Fettsaure) kann bestimmt werden, indem die 
modif izierten Mikroorganismen oder die modifizierte Pflanze 
unter geeigneten Bedingungen (wie den vorstehend beschriebenen) 

45 geziichtet werden und das Medium und/oder die zellularen Kompo- 
nenten auf die erhohte Produktion des gewiinschten Produktes (d.h. 
von Lipiden oder einer Fettsaure) untersucht wird. Diese Analyse- 
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techniken sind dem Fachmaiin bekannt und imfassen Spektroskopie, 
Diinnschiclitchromatographie, Farbeverfahren verschiedener Art, 
enzymatische imd mikrobiologische Verfahren sowie analytische 
Chromatographie , wie Hochleis tungs-Fliissigkeitschromatographie 
5 (siehe beispielsweise Ullman, Encyclopedia of Industrial 

Chemistry, Bd. A2 , S. 89-90 \md S. 443-613, VCH: Weinheim (1985); 
Fallon, A., et al . , (1987) "Applications of HPLC in Biochemistry" 
in: Laboratory Techniqxies in Biochemistry and Molecular Biology, 
Bd. 17; Rehm et al . (1993) Biotechnology, Bd. 3, Kapitel III: 

10 "Product recovery and purification", S. 469-714, VCH: Weinheim; 
Belter, P.A. , et al . (1988) Bioseparations : downstream processing 
for Biotechnology, John Wiley and Sons; Kennedy, J.F., und 
Cabral, J.M.S. (1992) Recovery processes for biological Materi- 
als, John Wiley and Sons; Shaeiwitz, J.A. , und Henry, J.D. (1988) 

15 Biochemical Separations, in: Ullmann's Encyclopedia of Industrial 
Chemistry, Bd. B3 ; Kapitel 11, S. 1-27, VCH: Weinheim; und 
Dechow, F.J. (1989) Separation and purification techniques in 
biotechnology, Noyes Publications) . 

20 Neben den oben erwahnten Verfahren werden Pf lanzenlipide aus 
Pf lanzermaterial wie von Cahoon et al. (1999) Proc . Natl- Acad. 
Sci. USA 96 (22) : 12935-12940, und Browse et al . (1986) Analytic 
Biochemistry 152:141-145, beschrieben extrahiert. Die qualitative 
und quantitative Lipid- oder Fettsaureanalyse ist beschrieben 

25 bei Christie, William W. , Advances in Lipid Methodology, Ayr/ 
Scotland: Oily Press (Oily Press Lipid Librairy; 2); Christie, 
William W. , Gas Chromatography and Lipids. A Practical Guide 
- Ayr, Scotland: Oily Press, 1989, Repr, 1992, IX, 307 S. (Oily 
Press Lipid Library; 1) ; "Progress in Lipid Research, Oxford: 

30 Pergamon Press, 1 (1952) - 16 (1977) u.d.T. : Progress in the 
Chemistry of Fats and Other Lipids CODEN. 

Zusatzlich zur Messung des Endproduktes der Fermentation ist 

es auch moglich, andere Komponenten der Stof fwechselwege zu ana- 

35 lysieren, die zur Produktion der gewtinschten Verbindoing verwendet 
werden, wie Zwischen- und Nebenprodukte, um die Gesamtef f izienz 
der Produktion der Verbindung zu bestimmen. Die Analyseverf ahren 
umfassen Messungen der Nahrstof fmengen im Medium (z.B. Zucker, 
Kohlenwasserstof f e, Stickstof f quellen, Phosphat und andere 

40 lonen) , Messungen der Biomassezusammensetzung und des Wachstums, 
Analyse der Produktion ublicher Metabolite von Biosynthesewegen 
und Messungen von Gasen, die wahrend der Fermentation erzeugt 
werden. Standardverf ahren fur diese Messungen sind in Applied 
Microbial Physiology; A Practical Approach, P.M. Rhodes iind P.F. 

45 Stanbury, Hrsgb., IRL Press, S. 103-129; 131-163 und 165-192 
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(ISBN: 0199635773) iind darin angegebenen Literaturstellen 
besciiri eben . 

Ein Beispiel ist die Analyse von Fettsauren (Abkiirzxmgen : FAME, 
5 Fett sauremethyles ter ; GC-MS , Gas-Fliissigkeitscliromatographie- 
Massenspektrometrie; TAG, Triacylglycerin; TLC, Durmschicht- 
chromatographie) . 

Der unzweideutige Nachweis fiir das Vorliegen von Fettsaure- 
10 produkten kann mittels Analyse rekombinanter Organismen nach 
Standard-Analyseverfahren erhalten werden: GC, GC-MS oder TLC, 
wie versctiiedentlich beschrieben von Christie und den Literatur- 
stellen darin (1997, in: Advances on Lipid Methodology, Vierte 
Aufl.: Christie, Oily Press, Dundee, 119-169; 1998, Gaschromato- 
15 graphie-Massenspektrometrie-Verfahren, Lipide 33:343-353) . 

Das zu analysierende Material kann durch Ultraschallbehandlung, 
Mahlen in der Glasmiihle, flussigen Stickstoff und Mahlen oder 
liber andere anwendbare Verfahren aufgebrochen werden. Das 

20 Material muss nach dem Aufbrechen zentrif ugiert werden. Das 
Sediment wird in Aqua dest. resuspendiert , 10 min bei 100°C 
erhitzt, auf Eis abgekuhlt und erneut zentrif ugiert , gefolgt 
von Extraktion in 0,5 M Schwef elsaure in Methanol mit 2 % 
Dimethoxypropan fiir 1 Std. bei 90°C, was zu hydrolysierten 01- 

25 und Lipidverbindungen ftihrt, die transmethylierte Lipide ergeben. 
Diese Fettsauremethylester werden in Petrolether extrahiert und 
schlieSlich einer GC-Analyse unter Verwendung einer Kapillarsaule 
(Chrompack, WCOT Fused Silica, CP-Wax-52 CB, 25 mikrom, 0,32 mm) 
bei einem Temperaturgradienten zwischen 170°C und 240°C fur 20 min 

30 und 5 min bei 240°C unterworfen. Die Identitat der erhaltenen 
Fettsauremethylester muss unter Veirwendung von Standards, die 
aus kommerziellen Quellen erhaltlich sind (d.h. Sigma) , definiert 
werden . 

35 Bei Fettsauren, ftir die keine Standards verfiigbar sind, muss die 
Identitat uber Derivatisierung und anschlieSende GC-MS-Analyse 
gezeigt werden. Beispielsweise muss die Lokalisierung von Fett- 
sauren mit Dreif achbindung uber GC-MS nach Derivatisierung mit 
4, 4-Dimethoxyoxazolin-Derivaten (Christie, 1998, siehe oben) 

40 gezeigt werden. 



45 
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Expressionskonstrukte in heterologen mikrobiellen Systemen 

Stamme, Wachstumsbedingiingen und Plasmide 

5 Der Escherichia coli-Stamm XLl Blue MRF' kan (Stratagene) wurde 
zur Subklonierung der neuen Desaturase pPDesaturasel aus Physco- 
itiitrella patens verwendet. Fur die funktionelle Expression dieses 
Gens verwendeten wir den Saccharomyces cerevisiae-Stannin INVSc 1 
(Invitrogen Co.). E. coli wurde in Luria-Bertini-Bruhe (LB, 

10 Duchefa, Haarlem, Niederlande) bei 37^0 kultiviert, Wenn notig, 
wurde Ampicillin (100 mg/Liter) zugegeben, und 1,5 % Agar (Gew./ 
Vol.) wurde fiir feste LB-Medien hinzugefiigt. S. cerevisiae wurde 
bei SO^C entweder in YPG-Mediuin oder in komplettem Miniitialmedium 
ohne Uracil (CMdum; siehe in: Ausubel, P.M., Brent, R. , Kingston, 

15 R.E., Moore, D.D., Seidnaan, J.G., Smith, J.A. , Struhl, K. , 
Albright, L.B., Coen, D.M. , und Varki, A. (1995) Current 
Protocols in Molecular Biology, John Wiley & Sons, New York) 
mit entweder 2 % (Gew. /Vol.) Raffinose oder Glucose kultiviert. 
Fur feste Medien wurden 2 % (Gew. /Vol.) Bacto'^-Agar (Difco) 

20 hinzugefiigt. Die zur Klonierung und Expression veinvendeten 
Plasmide sind pUCl8 (Pharmacia) und pYES2 (Invitrogen Co.) . 

Beispiel 17 : Klonierung und Expression PUFA-spezif ischer 
Desaturasen aus Phaeodactylum tricornutum 

25 

Fiir die Expression in Hefe wurden die Phaeodactyliun tricornutim 
-cDNA~-Klone aus Seq ID NO : 1, 3, 5 oder 11 bzw. die Sequenzen 
aus SEQ ID NO: 7 oder 9 bzw andere gewunschte Sequenzen zuerst so 
modifiziert, dass lediglich die Codierregion mittels Polymerase 

30 Kettenreaktion iinter Zuhilfenahme zweier Oligonukleotide ampli- 
fiziert werden. Dabei wurde darauf geachtet, dass eine Konsensu- 
sequenz vor dem Startcodon zur effizienten Translation ein- 
gehalten wurde. Entweder wurde hierzu die Basenfolge ATA oder 
AAA gewahlt -und vor das ATG in die Sequenz eingefugt (Kozak, M. 

35 (1986) Point mutations define a seq[uence flanking the AUG 
initiator codon that modulates translation by eukaryotic 
ribosomes. Cell 44, 283-292) . Vor diesem Konsensustriplett 
wurde zus^tzlich eine Restriktionsschnittstelle eingefiihrt, 
die kompatibel sein muss zur Schnittstelle des Zielvektors, 

40 in den das Fragment kloniert werden soil und mit dessen Hilfe 
die Genexpression in Mikroorganismen oder Pflanzen erfolgen 
soil . 



45 
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Die PCR-Reaktion wurde mit Plasmid-DNA als Matrize in einem 
Thermocycler (Biometra) mit der Pfu-DNA- (St ratagene) Polymerase 
imd dem folgenden Temperaturprogramm durchgefuhrt : 3 min bei 96°Cf 
gefolgt von 30 Zyklen mit 30 s bei 96°C, 30 s bei 55°C und 2 min 
5 bei 72°C, 1 Zyklus mit 10 min bei 72°C und Stop bei 4°C. Die 
Anlagerungs tempera tur wurde je nach gewahlten Oligonukleotiden 
variiert . Pro Kilobasenpaare DNA ist von einer Synthesezeit von 
etwa einer Minute auszugehen. Weitere Parameter, die Einfluss auf 
die PGR haben wie z.B. Mg-Ionen, Salz, DNA Polymerase etc., sind 
10 dem Fachmann auf dem Gebiet gelaufig und konnen nach Bedarf 
variiert werden. 

Die korrekte GroSe des amplif izierten DNA-Fragments wurde mittels 
Agarose-TBE-Gelelektrophorese bestatigt. Die amplif izierte DNA 

15 wurde aus dem Gel mit dem QIAguick-Gelextraktionskit (QIAGEN) 
extrahiert und in die Smal-Restriktionsstelle des dephosphory- 
lierten Vektors pUC18 unter Verwendung des Sure Clone Ligations 
Kit (Pharmacia) ligiert, wobei die pUC-Derivate erhalten wurden. 
Nach der Transformation von E. coli XLl Blue MRF' kan wurde 

20 eine DNA-Minipraparation (Riggs, M.G-, & McLachlan, A. (1986) A 
simplified screening procedure for large numbers of plasmid mini- 
preparation. BioTechniques 4, 310-313) an ampicillinresistenten 
Trans formanden durchgefuhrt, und positive Klone mittels BamHI- 
Restriktionsanalyse identif iziert , Die Sequenz des klonierten 

25 PCR-Produktes wurde mittels Resequenzierung unter Verwendxing des 
ABI PRISM Big Dye Terminator Cycle Sequencing Ready Reaction Kit 
(Perkin-Elmer , Welters tadt) bestatigt. 

A5 Acyl Lipid desaturase, Pt„des5 
30 Primer 1 GAG CTC ACA TAA TGG CTC CGG ATG CGG ATA AGC 
Primer 2 CTC GAG TTA CGC CCG TCC GGT CAA GGG 

Das PCR--Fragment (1428bp) wurde mithilfe des Sure Clone Kit 
(Pharmacia) in pUC 18 kloniert, das inserierte Fragment Sacl/Xhol 
35 verdaut und das Fragment mithilfe entsprechender Restriktions- 
schnittstellen in pYES2 oder pYES6 inseriert. 

A6 Acyl Lipid desaturase, Pt_des6 

Primer 3 GGA TCC ACA TAA TGG GCA AAG GAG GGG ACG CTC GGG 
40 Primer 4 CTC GAG TTA CAT GGC GGG TCC ATC GGG 

Das PCR-Fragment (1451 bp) wurde mithilfe des Sure Clone 
Kit (Pharmacia) in pUC 18 kloniert, das inserierte Fragment 
BamHI/XhoI verdaut und das Fragment mithilfe entsprechender 
45 Restriktionsschnittstellen in pYES2 oder pYES6 inseriert. 
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A12 Acyl Lipid desaturase, Pt_desl2 

Primer 5 GGA TCC ACA TAA TGG TTC GCT TTT CAA GAG CO 
Primer 6 CTC GAG TTA TTC GCT CGA TAA TTT GC 

5 A12 Acyl Lipid desaturase, Pt_desl2.2 

Primer 7 GGA TCC ACA TAA TGG GTA AGG GAG GTC AAC G 
Primer 8 CTC GAG TCA TGC GGC TTT GTT TCG C 

Das PGR Fragment (15 05bp) wurde mithilfe des Sure Clone 
10 Kit (Pharmacia) in pUC 18 kloniert, das inserierte Fragment 
BamHI/XhoJ verdaut und das Fragment mithilfe entsprechender 
Restriktionsschnittstellen in pYES2 oder pYES6 inseriert. 

Die Plasmid-DNA wurde mit Restriktionsenzym/en passend zur 
15 eingefuhrten Schnittstelle der Primers eqiienz gespalten und 
das erhaltene Fragment in die kompatiblen Restriktionsstellen 
des dephosphorylierten Hefe-E. coli-Shuttlevektors pYES2 oder 
pYESG ligiert, wobei pYES-Derivate erhalten werden. Nach der 
Transformation von E. coli und DNA-Minipraparation aus den 
20 Trans formanden wurde die Orientierung des DNA-Fragments im 

Vektor durch geeignete Restriktionsspaltung oder Sequenzierung 
liberpriift. Ein Klon wurde fiir die DNA-Maxipraparation mit dem 
Nucleobond® AX 500 Plasmid-DNA-Extraktionskit (3tocherey-Nagel , 
Diiringen) angezogen . 

25 

Saccharomyces cerevisiae IISIVScl wurde mit den pYES-Derivaten 
und pYES Leervektor mitt els eines PEG/Lithiumacetat-Protokolls 
transformiert (Ausubel et al . , 1995). Nach der Selektion 
auf CMd-ura-Agarplatten mit 2 % Glucose wurden pYES-Derivate- 
30 Trans formanden und eine pYES2 -Trans fozmande zur weiteren Anzucht 
und funktionellen Expression ausgew^hlt. Bei pYES6-Derivaten 
wurde Blasticidin als Antimetabolit verwendet . Im Fall von 
Coexpressionen auf Basis von pYES2 und pYES6 wurde auf Minimal- 
medium mit Blasticidin selektiert. 

35 

Funktionelle Expression einer Desaturaseaktivit^t in Hefe 
Vorkultur 

40 20 ml CMdum-Fliissigmedium ohne Uracil aber mit 2 % (Gew./Vol.) 
Raffinose wurden mit den transgenen Hefeklonen (pYES2) angeimpft 
und 3 Tage bei 30°C, 200 rpm gezuchtet, bis eine optische Dichte 
bei 600 nm (ODeoo) von 1/5 bis 2 erreicht wurde. Wurde als Vektor 
pYES6 ve3rwendet, so wurde zusatzlich auf Blasticidin als Anti- 

45 metabolit selektioniert . 
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Hauptkultur 

Fur die Expression warden 20 ml CMdum-FlussigmediTiin ohne Uracil 
aber mit 2 % Raffinose und 1 % (Vol. /Vol.) Tergitol NP-40 
5 mit Fettsauresubstraten auf eine Endkonzentration von 0,003 % 
(Gew./Vol.) angereichert . Die Medien wurden mit den Vorkulturen 
auf eine ODeoo von 0,05 angeimpft. Die Expression wurde bei einer 
OD600 von 0,2 mit 2 % (Gew./Vol.) Galaktose fiir 16 Std. induziert, 
wonach. die Kulturen eine ODeoo von 0,8-1,2 geerntet wurden. 

10 

Fettsaureanalyse 

Die Gesamt-Fettsauren wurden aus Hefekulturen extrahiert und 
mittels Gaschromatographie analysiert. Davon wurden Zellen von 5 

15 ml Kultur mittels Zentrifugation (1000 x g, 10 min, 4^C) geerntet 
und einmal mit 100 mM NaHCOs , pH 8,0, gewaschen, um restliches 
Medium und Fettsauren zu entfernen. Zur Herstellung des Fett- 
sauremethylester (FAMES oder Singular FAME) wurden die Zell- 
sedimente mit 1 M methanolischer H2SO4 und 2 % (Vol . /Vol . ) 

20 Dimethoxypropan fur 1 Std. bei 80°C behandelt. Die FAMES wurden 
zweimal mit 2 ml Petrolether extrahiert, einmal mit 100 mM NaHCOs, 
pH 8,0, und einmal mit destilliertem Wasser gewaschen und mit 
Na2S04 getrocknet. Das organische Losungsmittel wurde unter einem 
Argonstrom verdampft, und die FAMES wurden in 50 mikrol Petrol- 

25 ether geiast . Die Proben wurden auf einer ZEBRON-ZB-Wax-Kapillar- 
saule (30 m, 0,32 mm, 0,25 mikro m; Phenomenex) in einem Hewlett 
Packard-6850-Gaschromatograph mit einem Flammenionisations- 
detektor aufgetrennt. Die Of entemperatur wurde von 70°C (1 min 
halten) bis 200''C mit einer Rate von 20°C/min, dann auf 250°C 

30 (5 min halten) mit einer Rate von 5°C/min und schlieSlich auf 
260^*0 mit einer Rate von 5°C/min prograramiert . Stickstoff wurde 
als Tragergas ver^endet (4,5 ml/min bei 70°C) . Die Fettsauren 
wurden durch Vergleich mit Retentionszeiten von FAME-Standards 
(SIGMA) identif iziert . 

35 

Expr e s s i ons analy s e 

Die Verhaltnisse der zugegebenen und auf genommenen Fettsaure- 
substrate wurden ermittelt und so Quantitat und Qualitat der 
40 Desaturasereaktion gemaS Tabelle 6, Tabelle 7 und Tabelle 8 
erf asst. 



Ergebnis der Expression einer Phaeodactylum tricornutum A-6-Acyl 
Lipid Desaturase in Hefe: 

45 
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10 



Fe 1 1 s auire 


pYes2 


pYes2- 


-PtdS gefiittert 


mit 








+18:2 


+18:3 


16 : 0 


13 , 3 


18,9 


28,4 


16,7 


16 : 1A9 


45/ 4 


44,7 


12,5 


16,9 


16:2A6,9 




4,3 






18:0 


4,9 


6,3 


10,4 


9,1 


18:1A9 


36,4 


24,1 


6,8 


11,8 


18:2A6,9 




1,8 






18:2A9,12 






33,4 




18:3A6,12, 15 






4,9 




18:3A9,12,15 








43,1 


18:4A6,9,12,15 








2,3 



15 Die Angaben stellen Mol-% entsprechender cis-Fettsauren dar. 

Ergebnis der Expression einer Phaeodactylum tricornutum A-S-Acyl 
Lipid Desaturase in Hefe: 



20 Tabelle 7 



pYES2 



pYES_PtD5-Konstrukt gefuttert mit 



Fett- 



Kon-. 





saure Leer 


trolle 18:2 


18:3 


20:1 


-20:1 


20:2 


20:3 


20:3 


25 










A8 


All 


All,14 


as 


Q.6 




16: OA 16,9 


20,4 


27, 7 


24,4 


16,2 


21 


17, 6 


19,5 


22, 8 




16:1A9 44,7 


44, 1 


13,2 


9,6 


37,4 


39,4 


38,3 


36,9 


30,7 




18:0 6,1 


6,9 


10,54 


9,8 


4,7 


7,9 


6,3 


6,8 


8,2 




18:1A9 31,72 


28,1 


8,77 


6 


15 


26 


29,5 


25,6 


21,1 


30 


18 : 2 A5 , 9 


0,17 


0 


0 


0 


0, 09 


0,21 


0, 09 


9 




18 : 2 A9,12 




39,7 
















18:3 A9, 12, 15 






49,9 














20:1 A8 








25,5 












20:1 All 










5,41 








35 


20:2 A5, 11 










0,21 










20:2 All, 14 












6,48 








20:3 A5, 11,14 












0,76 








20:3 All, 14, 17 














9,83 






20:3 AS, 11, 14 
















13,61 


40 


20:4 A5, 11, 14, 17 














1,16 






20:4A5,8,11,14 
















3, 08 



Die Angaben stellen Mol-% Fettsauren von cis-Fettsauren dar. 
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Aus weiteren Futterungsversuchen wurde gefunden, dass C18:1A9 in 
der Anwesenheit von C18:2A9,11 oder C18 : 3 A9 , 12 , 15 oder C20:1A8 

Fettsauren nicht desaturiert wurde wahrend in Anwesenheit von 
C20:1A11, C20:2A11,14 und C20 : 3 AS , 11 , 14 auch C18:l desaturiert 
5 wird. Ebenfalls keine Desaturierung erfolgte in Anwesenheit von 
C20:3 A8,ll,14. 

Bei Nutzxing des Protease-def izienten Hefestammes C13BYS86 (Kunze 
I. et al., Biochemica et Biophysica Acta (1999) 1410:287-298) fur 

10 die Expression der A-5-Desaturase aus Phaeodactyltam tricornut\im 
auf VollmediTim mit Blasticidin wurde gefunden, dass C20:4 
A8,ll, 14,17 als Substrat der A-5-Desaturase mit 20 % Umsatzrate 
ebenso gut umgesetzt wurde wie C20:3 AS, 11, 14. Alternativ konnen 
auch die Axixotrophiemarker leu2 , ura3 oder his f iir Genexpression 

15 genutzt werden. 

In einem weiteren Coexpressionsexperiment von A-5 Desaturase aus 
Phaeodactyl\im und A-6 Elongase aus Physcomitrella wurde der Stamm 
UTL7A (Warnecke et al., J. Biol. Chem. (1999) 
20 274 (19) : 13048-13059)benutzt, wobei die A-5 Desaturase ca 10 % 
C20:3 A8,ll,14 zu C20:4 A5,8,ll,14 umsetzte. 

Weitere Ftitterungsexperimente mit vers chiedens ten anderen 
Fettsauren allein oder in Kombination (z.B. Linolsaure, 20:3 
25 A-5, 11, 14-Fettsaure, alpha- oder gamma Linolensaure , Stearidon- 
saure, Arachidonsaure, EicosapentaensSure etc.) k5nnen zur 
detaillierteren Bestatigung der Substratspezif itSt und 
-Selektivitat dieser Desaturasen durchgefiihrt werden. 



30 Tabelle 8: 



Ergebnis der Coxpression einer Phaeodactylum tri- 
comutum A-5-Acyl Lipid Desaturase und einer A-6 
Elongase aus Moos in Hefe auf Basis der Expressions- 
vektoren pYes2 xmdpYesS 



35 



pYes2-Elo 



pYes2-Elo and pYes6-Ptd5 



40 



+18:3 
15, 0 
27,7 
5,6 
17,1 
7, 60 



16:0 
16 : 1A9 
18:0 
18 : 1A9 
18:3A6,9,12 
18:4A6,9,12,15 
20:3A8,11,14 15,92 
45 20:4A5, 8, 11, 14 
20:4A8,11,14,17 
20:5A5,8,11,14,17 - 



+18:4 

14,8 
29,2 
6,3 
30,8 

6,71 



11,4 



+18:3 
15, 6 
27,5 

5,7 
27,4 

7,8 

13,55 
1,31 



+ 18:4 
15, 1 
29, 0 
6,4 
31,6 

6,4 



10,31 
0,53 
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Aus den Substratiimsetzungen geht hervor, dass die verwendete 
2^-5-Desaturase aus Phaeodactylum und die A-6-Elongase aus 
Physcomitrella patens bzgl. der Substrataktivitat und ins- 
besondere der Substratspezif itat geeignet sind, um Arachidon- 
5 saure bzw. Eicosapentaensaure mithilfe erf indungsgema£er 
Sequenzen zu produzieren. 

Die Fragment ierungsmuster und Massenspektren von DMOX-Derivaten 
von Standards als auch den Peakf raktionen per GC identif izierter 
10 Fettsauren der in Tabelle 6, 7 und 8 auf gef lihrten, zeigen 
vergleichsweise identische Ergebnisse, wodurch. die jeweilige 
Position der Doppelbindung liber die bloSe GC-Detektion hinaus 
abgesichert wurde. 

15 Beispiel 18: Reinigung des gewunschten Produktes aus 

trans formierten Organismen 

Die Gewinnung des gewunschten Produktes aus Pf lanzenmaterial oder 
Pilzen, Algen, Ciliaten, tierischen Zellen oder aus dem Uberstand 

20 der vorsteiiend beschriebenen Kulturen kann durch verschiedene, 
im Fachgebiet bekannte Verfahren erfolgen. Wird das gewunschte 
Produkt nicht aus den Zellen sezerniert, konnen die Zellen aus 
der Kultur durch langsame Zentrif ugation geerntet werden, die 
Zellen konnen durch Standardtechniken, wie mechanische Kraft oder 

25 Ultraschallbehandlung, lysiert werden, Organe von Pflanzen konnen 
mechanisch von anderem Gewebe oder anderen Organen getrennt 
werden. Nach der Homogenisation werden die Zelltrummer durch 
Zentrif ugation entfernt, und die Uberstandsf raktion, welche 
die loslichen Proteine enthalt, wird zur weiteren Reinigung 

30 der gewOnschten Verbindung aufbewahrt. Wird das Produkt aus 

gewunschten Zellen sezerniert, werden die Zellen durch langsame 
Zentrif ugation aus der Kultur entfernt, und die Uberstands- 
f raktion wird zur weiteren Reinigung aufbewahrt. 

35 Die Uberstandsf raktion aus jedem Reinigungsverf ahren wird einer 
Chromatographie mit einem geeigneten Harz unterworfen, wobei das 
gewunschte Molekiil entweder auf dem Chromatographieharz zuriick- 
gehalten wird, viele Verunreinigungen in der Probe jedoch nicht, 
Oder die Verunreinigungen auf dem Harz zurtickbleiben, die Probe 

40 hingegen nicht. Diese Chromatographieschritte kSnnen wenn notig 
wiederholt werden, wobei die gleichen oder andere Chromato- 
graphieharze verwendet werden. Der Fachmann ist in der Auswahl 
geeignet er Chromatographieharz e und ihrer wirksamsten Anwendung 
fiir ein bestimmtes zu reinigendes Molektil bewandert. Das 

45 gereinigte Produkt kann durch Filtration oder Ultrafiltration 
konzentriert und bei einer Temperatur aufbewahrt werden, bei 
der die Stabilitat des Produktes maximal ist. 
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Im Fachgebiet ist ein breites Spektrum an Reinigungsverf ahren 
bekannt, und das vorstehende Reinigungsverf ahren soil nicht 
beschrankend sein. Diese Reinigungsverf ahren sind zum Bei- 
spiel beschrieben in Bailey, J.E. , & Ollis, D.F., Biochemical 
5 Engineering Fundamentals, McGraw-Hill: New York (19 86) . 

Die Identitat und Reinheit der isolierten Verbindungen kann 
durch Standardtechniken des Fachgebiets bestimmt werden. Dazu ge- 
horen Hochleistungs-Fliissigkeitschromatographie (HPLC) , spektro- 

10 skopische Verf ahren, Farbeverf ahren, Diinnschichtchromatographie, 
insbesondere Diinnschichtchromatographie und Flammenionisations- 
detektion (lATROSCAN, latron, Tokio, Japan) , NIRS, Enzymtest oder 
mikrobiologisch. Eine Ubersicht uber diese Ana lys ever f ahren siehe 
in: Patek et al . (1994) Appl . Environ. Microbiol. 60:133-140; 

15 Malakhova et al. (1996) Biotekhnologiya 11:27-32; und Schmidt et 
al. (1998) Bioprocess Engineer. 19:67-70. Ulmann's Encyclopedia 
of Industrial Chemistry (199 6) Bd. A27, VCH: Weinheim, S. 89-90, 
S. 521-540, S. 540-547, S. 559-566, 575-581 und S. 581-587; 
Michal, G (1999) Biochemical Pathways: An Atlas of Biochemistry 

20 and Molecular Biology, John Wiley and Sons; Fallon, A., et al . 
(1987) Applications of HPLC in Biochemistry in: Laboratory 
Techniques in Biochemistry and Molecular Biology, Bd. 17. 

Aq^i i va 1 en t e 

25 

Der Fachmann erkennt oder kann viele Aquivalente der hier 

beschriebenen erf indungsgemaiSen spezifischen Ausf tihrungsf ormen 
feststellen, indem er lediglich Routineexperimente verwendet. 
Diese Aquivalente sollen von den Patentanspriichen umfasst sein. 



35 
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Patentanspriiche 

1. Expressionskassette mit einer Struktur ausgewahlt aus der 
5 Gruppe : 

a) LI - Promoter - Strukturgen - L2 , 

b) LI - Promotor - Strukturgen - L2 - Ll - Promotor - Struk- 
10 turgen - L2, 

c) LI - Promotor - Strukturgen - L2 - Ll - Promotor - Struk- 
turgen - L2 - LI - Promotor - Strukturgen - L2, 

15 wobei Ll, L2 , Promotor und Strukturgen die folgende Bedeutung 

hat: 

LI = SEQ ID NO: 32 oder sine aquivalente Restriktionsschnitt- 
stellen enthaltende Sequenz, 
20 L2 = unabhangig voneinander SEQ ID NO: 33, 34 oder 35 oder 

aquivalente Restriktionsschnittstellen enthaltende Se- 

quenzen, 

Promotor = pflanzlicher Promotor 
Strukturgen = eine in Pflanzen exprimierbare 
25 Nukleinsauresequenz . 

2. Expressionskassette nach Anspruch 1, wobei das Strukturgen 
ein Biosynthesegen ist . 

30 3. Expressionskassette nach Anspruch 1 oder 2, wobei das Struk- 
turgen ein Biosynthesegen des Lipid- oder Fettsaurestof fwech- 
sels ist. 

4. Expressionskassette nach den Anspruche 1 bis 3, wobei das 
35 Strukturgen ein pflanzliches Gen ist. 



40 
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5. Expressionskassette nach den Anspriiche 1 bis 4/ wobei das Gen 
eine Nukleinsauresequenz ist, die ftir Proteine ausgewahlt aus 

der Gruppe : 

Acyl-CoA-Dehydrogenase (n) , Acyl-ACP[= acyl carrier protein]- 
5 Desaturase (n) , Acyl-ACP-Thioesterase (n) , Fettsaure-Acyl- 

Transferase (n) , Fetts^ure-Synthase (n) , Fettsaure-Hydroxy- 
lase(n), Acetyl-Coenzym A-Carboxylase (n) , Acyl-Coen- 
zym A-Oxidase (n) , Fettsaure-Desaturase (n) , Fettsaure- 
Acetylenasen, Lipoxygenasen, Triacylglycerol-Lipasen, 
10 Allenoxid-Synthasen, Hydroperoxid-Lyasen oder Fettsaure- 

Elongase(n) , kodiert . 



15 



6. Expressionskassette nach den Anspriiche 1 bis 5, wobei das Gen 
eine Nukleinsauresequenz ausgewahlt aus der Gruppe ist: 

a) einer Nukleinsauresequenz mit der in SEQ ID NO: 1, 
SEQ ID NO: 3, SEQ ID NO : 5 oder SEQ ID NO: 11 dar- 
gestellten Sequenz, 



20 b) Nukleinsauresequenzen, die aufgrund des degenerierten 

genetischen Codes durch Riickiibersetzung der in 
SEQ ID NO: 2, SEQ ID NO : 4, SEQ ID NO : 6 oder 
SEQ ID NO: 12 dargestellten Amino saure sequenz en 
erhalten werden, 

25 

c) Derivate der in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5 
oder SEQ ID NO: 11 dargestellten Nukleinsauresequenz, die 
ftir Polypeptide mit der in SEQ ID NO: 2, SEQ ID NO: 4, 
SEQ ID NO: 6 oder SEQ ID NO: 12 dargestellten Aminosaure- 
30 sequenz en codieren und mindestens 50 % Homologie auf 

Aminosaureebene aufweisen, ohne da£ die enzymatische 
Wirkung der Polypeptide wesentlich reduziert ist. 



7 . Verwendung von Expressionskassetten gemaS den Anspuchen 1 bis 
35 6 in einem Verfahren zur Herstellung von Fettsaureestern mit 

einem erhohteiti Gehalt an mehrfach ungesattigten Fettsauren 
mit mindestens zwei Doppelbindungen dadurch gekennzeichnet , 
daS man die Expressionskassette in einen Fettsaureester pro- 
duzierenden Organismus einbringt, anzieht und die in dem Or- 
40 ganismus enthaltenen Fettsaureester isoliert. , 

8 . Verfahren nach Anspruch 7 , wobei die durch das Verfahren 

hergestellten Fettsaureester mehrfach ungesattigte Cis-/ C20-" 
oder C22~"F®ttsauremolekiile mit mindestens zwei Doppelbindungen 
45 im Fettsaureester enthalten. 



wo 02/057464 



PCT/EP02/00461 



113 

9, Verfahren nach Anspruch 7 oder 8, wobei die Cis-, C20- oder 
C22-Fettsauremolekule aus dem Organismus in Form eines 6ls, 
Lipids isoliert werden. 

5 10. Verfahren nach. den Anspriichen 7 bis 9, wobei der Organismus 
eine transgene Pflanze ist. 

11. Verfahren nach den Anspruchen 7 bis 10, wobei die Fettsaure- 
ester Cis-/ C20'" oder C22~Fettsauren mit drei , vier oder fiinf 

10 Doppelbindungen im Fettsaureester enthalten. 

12. Verfahren nach den Anspruchen 7 bis 11, dadurch gekenn- 
zeichnet, daJ2> man die in den Fettsaureestern enthaltenden 
mehrfach ungesattigten Fettsauren freisetzt. 

15 

13 . Vektor enthaltend eine Expressionskassette gemaJS den Anspru- 
chen 1 bis 6 . 

14. Organismus enthaltend mindestens eine Expressionskassette ge- 
20 maS den Anspruchen 1 bis 6 oder mindestens einen Vektor gemaS 

Anspruch 13 . 

15. Organismus nach Anspruch 14, wobei es sich bei dem Organismus 
um eine Pflanze handelt. 

25 

16. Transgene Pflanze enthaltend eine funktionelle oder nicht 
funktionelle Nukleinsauresequenz in einer Expressionskassette 
gemaS den Anspruchen 1 bis 6 . 

30 17. Verwendung einer einer Expressionskassette gemalS den Anspru- 
chen 1 bis 6 zur Herstellung von transgenen Pflanzen. 



35 
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Figur 1: Polypeptidvergleich der Codierregionen von Pp_des 6 (obere 
Reihe) mit der EST-Sequenz von PT001078032R (untere Reihe) 

398 WKPLVWMAVTELMSGMLLGFVFVLSHNGMEVYNSSKEFVSAQI VSTR 444 

W+ + + + + li -hF LSHN + S4- +A + V T 

43 0 WRVFGNIMLMGVAESLALAVLFSLSHN FESADRDPTAPLKKTGEPVDWFKTQVETS 2 63 

445 DIKGNIFlSroWFTGGL3SnRQIEHHLFPTMPRHlSrL]>nCIAPRVEVFCKKH 494 

G + FTGGLN Q+EHHLFP M lAP+V C KHG+ Y 

2 62 CTYGGFLSGCFTGGLNFQVEHHLFPRMSSAWYXYIAPKVREICAKHGVHY 113 



Figur 2: Polypeptidvergleich von Codierregionen der Ma_desl2 
(obere Sequenz) mit PT001070010R 

105 GVWVLAHECGHQSFSTSKTLNN 126 

G WVLAHECGH +FS +++L + 
533 GFWVIiAHECGHGAFSKNRSLQD 598 

Figur 2a: Polypeptidvergleich von Codierregionen der Ma_desl2 
(obere Sequenz) mit PT001072031R 

117 SFSTSKTLNNTVGWILHSMLLVPYHSWRISHSKHH 151 

++S S+T N+ VG+I+H LLVPY +W+ +H+KHH 
465 AYSDSQTFNDWGFIVHQALiIjVPYFAWQYTHAKHH 569 



Figur 3: Polypeptidvergleich von Codierregionen eines PCR 

Produktes aus Primerpaar F6a und R4a2 codierend fiir* ein 
Desaturase Fragment (obere Reihe) aus Phaodactylum mit 
der Sequenz T3 6617 aus Streptomyces coelicolor (untere 
Reihe) 

1 WWKNKHNGHHAVPNLHCSSAVAQDGDPDIDTMPLLAWSVQQAQSYRELQADGKDSGLVKF 60 
WW++KH HHA PN +D DPDI LL WS QA++ +GL + 

114 WWQDKHTRHHANPN TEDLDPDIGP-DLLVWSPDQARAA TGLPRL 156 

61 MIRNQSYFYFPILLLARLSWLNESFKCAFGLGAASENAALELKAKGLQYPLLEKAGILLH 120 
+ R Q++ +FP+L Ii E F G A N L+ -hA L+ A +ri H 

157 LGRWQAFLFFPLLTL EGFNLHVASGRAMANRRLKRRA LDGALIiLAH 2 02 

121 YAWMLTVSSGFGRXXXXXXXXXXXXXXXXCGFLIA.IVFGLGHNGMATYNAD^ 180 

ALTF -GLFHGMAD RPDF + Q 

203 CAVYIiTAL — FWVLPPGMAIAFLAVHQCLFGVYLGSAFAPNHKGMPILTADDRPDFLRRQ 260 
181 VTTTRNVTGGHGFPQAFVDWFCGGLQYQVDHHIiFPS 216 

V T+RNV GG F D GGL +Q++HHIiFPS 

261 VLTSRNVNGG LFTDLALGGLNHQIEHHLFPS 291 
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Figur 4 s Polypeptidvergleich von Codierregionen aus Pp„des6 
(obere Reihe) verglichen mit Pt_des6 (imtere Reihe) 

51 KRLTSKKRVSESAAVQCISAEVQRNSSTQGTAEAIiAESWKPTRRRSSQW 100 

1 MGKGGDARASKG 12 

101 KKSTHPLS. .EVAVHNKPSDCWIVVKNKVYDVSNFADEHPGGSVISTYFG 148 

. :| 11 1 1 I 11: millll. IlllMl |: I 
13 STAARKISWQEVKTHASPEDAWIIHSNKVYDVSNW.HEHPGGAVIFTHAG 61 

, . • • • 

149 RDGTDVFSSFHAASTWKILQDFYIGDV, .ERVEPTPELL, . .KDFREMRA 193 

62 DDMTDIFAAFHAPGSQSLMKKFYIGEIiLPETTGKEPQQIAFEKGYRDLRS 111 

194 LFLREQLFKSSKLYYVMKLLTWAIFAASIAIICWSKTISAVLASACJMA 243 

: :|1 1 l-MMl. I- =1 I 111 I 

112 KLIMMGMFKSNKWFYVYKCLSNMAIWAAACAiVFYSDRFWVHL^ 161 

. • . • • 

244 LCFQQCGWLSHDFLHNQVFETRWLNEWGYVIGNAVLGFSTGWWKEKHNL 293 

III III.IIMI.MI I - I II • I--I III III 

162 TFFQQSGWLAHDFLHHQVFTKRKHGDLGGLFWGNLMQGYSVQWWKNKHNG 211 

, • • • • 

294 HHAAPN.ECDQTY.QPIDEDIDTLPLIAWS KDILATVENKTFL 334 

111 It I 11 1111:11:111 ::: 1 • 

212 HHAVPlNlIiHCSSAVAQDGDPDIDTMPLLAWSVQQAQSYRELQADGKDSGIiV 261 

335 R . ILQYQHLFFMGLLFFARGSWLFWSWR YTSTAVLSPVDR. . . 373 

: I |: =1 Mill • II 

2 62 KFMIKt^QSYFYFPILLLARLSWLNESFKCAFGLGAASENAALELKAKGLQ 311 

374 . . LLEKGTVLFHYFWFVGTAC . YLLPGWKPLVWMAVTELMS . GMLLGFVF 419 

111! :M1| . . :- . . .| I I II II 

312 YPLLEKAGILLHYAWMIiWSSGFGRFSFAYTAFYFriTATASCGFLrjAIVF 3 61 

420 VI.SHNGMEVYNSS. .KEFVSAQIVSTRDIKG NIFNDWFTGGLNRQ 462 

I III! II. :1 I: .11.: 1 I 111 Ml 1 

362 GLGHNGMATYNADARPDFWKLQVTTTRNVTGGHGFPQAFVDWFCGGLQYQ 411 

. • • ■ • 

463 lEHHLFPTMPRHNLNKIAPRVEVFCKKHGLVYEDVSIATGTCKVLKALKE 512 

::|I1I|.:MI1II M MM M 1 : : II Ml I 

412 VDHHLFPSLPRH]Sn:jAKTHALVESFCKEWGVQYHEADLVDGTMEVLHHLGS 461 

513 VAEAAAEQHATTS 525 

II I 
462 VAGEFWDFVRDGPAM. 477 
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Figur 5: Polypeptidvergleich von Codierregionen aus Pp_des6 
(obere Reihe) verglichen mit Pt_des5 (untere Reihe) 

51 KRLTSKKRVSESAAVQCISAEVQRNSSTQGTAEALAESWKPTRRRSSQW 100 

1 MAPDADKIiRQRQTTAV 16 

101 KKSTHPLSEVAVHNKPSDC WIWK3SFKVYDVSNFADEHPGGSVIS 144 

II.:. : : : :| I- -I Hill I 

17 AK. .HNAATISTQERLCSLSSLKGEEVCIDGIIYDLQSF. .DHPGGETIK 62 

• • • • • 

145 TYFGRDGTDVFSSFHAASTWKILQDF . YIGDVERVEPTPELLKDF . REM. 191 

: 1 I I : I 1 II: Ul • :| IL 

63 MFGGNDVTVQYKMIHPYHTEKHLEKMKRVGKVTDFVCEYKFDTEFEREIK 112 

192 RALFLREQLFKS.SKLYYVMKLLTNVAIFAASIAIICWSKT.ISAVLASA 239 

I .1 . I I : : I I I -111 

113 REVFKIVRRGKDFGTLGWFFRAFCYIAIF . . FYLQYHWVTTGTSWLLAVA 160 

« • • • • 

240 CMMALCFQQCGWLSHDFLHNQVFETRWLlSnErVVGYVIGNAVLGFSTGWWKE 2 89 

. II I . |.|:..| :| :| 1 M 

161 YGISQAMIGMN.VQHDANHGATSKRPWVNDMLG. . LGADFIGGSKWLWQE 207 

29 0 KHNLHHAAPNECDQTYQPIDEDIDTLPLIAWSKDILATVENKTFLRILQY 339 

.11111: 1 : !::..! :|.| - = 

208 QHWTHHAYTNHAEM. .DP. .DSFGAEPMLLFN.DYPLDHPARTWLH. .RF 250 

340 QHLFFMGLLFFARGSWLFWSWR YTSTAVLS . . . PVDRLLEKGTVL 3 81 

I hi .1 I II - II .1 

251 QAFFYMPVL. . .AGYWIiSAVFNPQILDLQQRGALSVGIRIiDNAFIHSRRK 297 

382 FHYFW. . .FVG. . . .TACYLLPG. . . . WKPLVWMAVTELMSGMLLGFVFV 420 

: II :: II h . . . : | -j 

298 YAWWRAWIAVNVIAPFYTNSGLEWSWRVFGNIMLM6VAESLALAVLFS 347 

• • . . • 

421 LSHN GMEVYNSSKEFVSAQIVSTRDIKGNIFNDWFTGGLN 460 

INI :. I M I . Iimi 

348 LiSHNFESADRDPTAPLKKTGEPVDWFKTQ.VETSCTYGGFLSGCFTGGLN 39 6 

. . . - • 

461 RQIEHHLFPTMPRHNLNKIAPRVEVFCKKHGIiVYEDVS . lATGTCKVLKA 509 

hllllll I llhl I III. I I 

397 FQVEHHLFPRMSSAWYPYIAPKVREICAKHGVHYAYYPWIHQNFIiSTVRY 446 

510 LKEVAEAAA.EQHATTS 525 

III. I 
447 MHAAGTGAJJWRQMARENPLTGRA. 469 
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Figur 6: Polypeptidvergleich von Codierregionen der A-12-Desatu- 
rase aus Mortierella alpina (Ma_desl2) obere Reihe itiit 
der homologen Sequenz aus Phaeodactylum tricornutum 
(Pt_desl2) in der unteren Reihe 

40 KEIRECIPAHCFERSGLRGLCHVAIDLTWASLL. .FLAATQIDKFE. .NP 85 

1::| II III : I I .=1 ■ I = =11 

107 KDLRAVIPKDCFEPDTAKSLGYIiSVS.TMGTILCSWGANLLSVLDPSNP 155 

86 LIRYLAWPVYWIMQGIVCTGVWVLAHECGHQSFSTSKTLNNTVGWILHSM 135 

I : I I - I I Mllllllll .11 .:.| • IhhII. 
156 L.TWPLWAAYGAWGWAMGLWVIiAHECGHGAFSKNRSLQDAVGYIIHSl 204 

13 6 LLVPYHSWRISHSKHHKATGHMTKDQVFVPKTRSQVGLPPKENAAAAVQE 185 

:llll II. I|. I|. 1 II : II .1 I . 1 I 

205 MLVPYFSWQRSHAVHHQYTNHMELGETHVPDRADKEG. . . -EKSLAIiRQF 250 

186 EDMSWLDEEAPIVTDFWMVIQFLFGWPAYLIMNASGQDYGRWTSHFHTY 235 

I |. : : lllllh. |.| 

251 lyniiDSFGKDKGMKAYGGLQSFLHLIVGWPAYLLIGATGGPDRGMTNHFYP. 299 

236 SPIFEP. . . .RNFF DIIISDLGVLAALGALIYASMQLSLLTVTK 275 

• hi : I : I .1111 . II 

3 00 NPLSTPTQPKKELFPGI^KEKVYQSDIGIAAWGALIAWTATSGLAPVMA 349 

276 YYIVPYLFVNFWLVLITFLQHTDPKLPHYREGAWNFQRGALCTVDRSFGK 325 

350 LYGGPIilVINAWLiVLYTWLQHTDTDVPHFSSDNHNFVKGALHTIDRPYDK 399 

a • • • • 

326 FLDHMFHGIVHTHVAHHIiFSQMPFYHAEEATYHLKKLLGEYYVYD 370 

:| : II Mini I .1 I h II :| I Ml 

400 LDPWGIIDFLHHKIGTTHVAHHFDSTIPHYKAQIATDAIKAKFPEVYLYD 449 

371 PSPIWAVWRSFRECRFVEDQGDWFFK 398 

Ml Ml : I II -11 .1 
450 PTPXPQAMWRVAKGCTAVEQRGDAWVWK 477 
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Figur 7: Polypeptidvergleich von Codierregionen der A-12- 

Desaturase aus Mortierella alpina (Ma_desl2) obere 
Reihe mit der homologen Sequenz aus Phaeodactylum tri- 
cornutum Klon PT001072031R (Pt_desl2.2) in der unteren 
Reihe . 

, • • • • 

22 NSAKPAFERNYQLPEFTIKEIRECIPAHCFERSGLRGLCHVAIDLTWASL 71 

.1 I . . :|| 1 :|: II Ihll - II L 

33 SSYNPLAKDSPEIiP. .TKGQIKAVIPKECFQRSAFWSTFYLMRDLiyv]^^ 80 

72 LFLAATQIDKFENP LIRYLAWPVYWIMQGIVCTGVWVLAHECGH 115 

.|: : I I Mil I : M II.MIIII 

81 FCYGTSQVLSTDLPQDATLILPWALGWGVYAFWMGTILTGPWWAHECGH 13 0 

116 QSFSTSKTLrOTTVGWILHSMLLVPYHSWRISHSKHHKATGHMT 165 

.:] M |. ll-M mil .1. .Mil: I h : 11 
131 GAYSDSQTFNDWGFIVHQALLVPYFAWQYTHAKHHRRTNHLVDGESHVP 180 

166 KTRSQVGLPP. .KENAAAAVQEEDMSVHLDEEAPIVTLFWMVIQFLiFGWP 213 

I III . h I II : I I I Ml 

181 STAKDNGLGPHNERNSFYAAWHEAMG. . . .DGAFAVFQVWS. .HLFVGWP 224 

214 AYIil.MNASGQ. *DYGRW TSHFHTYSPIFEPRNFFDIIISDIiG 253 

II : ..|. II 11 IM : I =1 

225 LYLAGLASTGKLAHEGTAnATDEEi^AIADHFRPSSPMFPAKIRAKIA^ 274 

254 VLAAIiGALIYASMQLSLLTVTKYYIVPYLFVNFWLVLITFLQHTDPKLPH 303 

II 1 hi 1. II :i 11 111 nil Minn ni 

275 ELAVLAGLLYVGTQVGHLPVLLWYWGPYTFVNAWLVLYTWLQHTDPSIPH 324 

3 04 YREGAWNFQRGALCTVDRSFGKFLDHMFHGIVHTHVAHHLFSQMPFYHAE 353 

III M :iii Ml nil II III nil ninn 

325 YGEGEWTWVKGALSTIDRDYGIF.DFFHHTIGSTHVVHHLFHEMPWYNAG 373 

354 EATYHLKKLLGE. .YYVYDPSPIWAVWRSFRECRFVEDQGDWFFK 398 

II -1. I I 111. I l-i! M :|l I :|l 

374 lATQKVKEFLEPQGLYNYDPTPWYKAMWRlARTCHYVESNEGVQYFK 420 
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SEQUENZPROTOKOLL 



<110> BASF Plant Science GmbH 

<120> Verfahren 2ur Expression von Biosynthesegenen. in 
pf lanzliciien Samen unter Verwendung von neuen 
multiplene Express ionskonstrnikt en 

<130> 2000_904 

<140> 2000^904 
<141> 2000-12-22 

<160> 35 

<170> Patentin Vers. 2.0 

<210> 1 
<211> 1652 
<212> DNA 

<213> Phaeodactylum tricomutum 

<220> 
<221> CDS 

<222> (115) . . (1524) 
<400> 1 

gacccaacaa acccaacaat cccaacaatc ccatcaacag gaattgggtt tcgttgagtc 60 

aataattgct agaatccaaa cagacagaca gagaccaacc gcatctatta caga atg 117 

Met 
1 

get cog gat gcg gat aag ctt cga caa cgc cag acg act gcg gta gcg 165 
Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val Ala 
5 10 15 

aag cac aat get get acc ata teg acg cag gaa cgc ctt tgc agt ctg ' 213 
Lys His Asn Ala Ala Thr lie Ser Thr Gin Glu Arg Leu Cys Ser Leu 
20 25 30 

tet teg etc aaa ggc gaa gaa gtc tgc ate gac gga ate ate tat gac 261 
Ser Ser Leu Lys Gly Glu Glu Val Cys lie Asp Gly lie lie Tyr Asp 
35 40 45 

etc caa tea ttc gat cat cec ggg ggt gaa acg ate aaa atg ttt ggt 3 09 
Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr lie Lys Met Phe Gly 
50 55 60 65 

ggc aac gat gtc act gta cag tac aag atg att cac ccg tac cat acc 357 
Gly Asn Asp Val Thr Val ' Gin Tyr Lys Met lie His Pro Tyr His Thr 

70 75 80 

gag aag cat ttg gaa aag atg aag cgt gtc ggc aag gtg acg gat ttc 405 
Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp Phe 
85 90 95 



gtc tgc gag tac aag ttc gat acc gaa ttt gaa cgc gaa ate 



aaa cga 



453 



Val Cys Glu Tyr Lys Phe Asp Thr Glu Phe Gin Arg ' Glu He Lys Arg 
100 105 110 

gaa gtc ttc aag att gtg cga cga ggc aag gat ttc ggt act ttg gga 501 
Glu Val Phe Lys He Val Arg Arg Gly Lys Asp P3ae Gly Thr Leu Gly 
115 120 125 

tgg ttc ttc cgt gcg ttt tgc tac att gcc att ttc ttc tac ctg cag 549 
Trp Phe Phe Arg Ala Phe Cys Tyr He Ala He Phe Phe Tyr Leu Gin 
130 135 140 ' * 145- 

tac cat tgg gtc acc acg gga acc tct tgg ctg ctg gcc gtg gcc tac 597 
Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala Val Ala Tyr 
150 155 160 

gga ate tec caa gcg atg att ggc atg aat gtc cag cac gat gcc aac 645 
Gly Hp Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala Asn 
165 170 175 

cac ggg gcc acc tec aag cgt cec tgg gtc aac gac atg dta ggc etc 693 
His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly Leu . 
180 185 190 

ggt gcg gat ttt att ggt ggt tec aag tgg etc tgg cag gaa caa cac 741 
Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin His 
195 . 200 205 

tgg ace cac cac get tac ace aat cac gcc gag atg gat cec gat age 789 
Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp Ser 
210 215 220 225 

ttt ggt gcc gaa cea atg etc eta ttc aac gac tat cec ttg gat cat 837 ,, 
Phe Gly Ala- Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp His 
230, 235 240 

cec get cgt ace tgg eta eat cge ttt caa gea ttc ttt tac atg cec 885 
Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met Pro 
245 250 255 

gtc ttg got gga tac tgg ttg tec get gtc ttc aat cca caa att ctt 933 
Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He Leu . 
260 265 270 

gac etc cag caa cgc ggc gea ctt tec gtc ggt ate cgt etc gac aac 981 
Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Giy He Arg Leu Asp Asn 
275 280 285 

get ttc att cac teg cga cgc aag tat gcg gtt ttc tgg egg get gtg 1029 
Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala Val 
290 295 300 305 

tac att gcg gtg aac gtg att get ccg ttt tac aca aac tec ggc etc 1077 
Tyr He Ala Val Asn Val He * Ala Pro Phe Tyr Thr Asn Ser Gly Leu 
310 315 320 

gaa tgg tec tgg cgt gtc ttt gga aac ate atg etc atg ggt gtg gcg 1125 
Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val Ala 
325 330 335 
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gaa teg etc gcg ctg gcg gtc ctg ttt teg ttg teg eac aat ttc gaa 1173 
Glu Ser Leu Ala Leu Ala Val: Leu Phe Ser Leu Ser His Asn Phe Glu 
340 345 350 



tec gcg gat cgc gat ccg acc gee cca ctg aaa aag acg gga gaa cea 1221 
Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu Pro 
355 . 360 365 

gtc gac tgg ttc aag aca cag gtc gaa act tec tgc act tac ggt gga 1269 
Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly Gly 
370 . 375 380 385 

ttc ctt tec ggt tgc ttc acg gga ggt etc aac ttt cag gtt gaa cac 1317 
Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asn Phe Gin Val Glu His 
390 395 400 

cac ttg ttc cca cgc atg age age get tgg tat cec tac att gee cec 13 65 
His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr lie Ala Pro 
405 410 415 

aag gtc cgc gaa att tgc gcc aaa cac ggc gtc cac tac gcc tac tac .1413 
Lys Val Arg Glu lie Cys Ala Lys His Gly Val His Tyr Ala Tyr Tyr 
420 425 430 

ccg tgg ate cac caa aac ttt etc tee ace gtc cgc tac atg cac gcg 1461 
Pro Trp lie His Gin Asn Phe Leu Ser Thr Val Arg Tyr. Met His Ala 
435 440 445 

gcc ggg acc ggt gcc aac tgg cgc cag atg gee aga gaa. aat cec ttg 1509 
Ala Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro Leu 
450 455 460 465 

acc gga egg gcg taa aagtacacga cacgaccaaa ggtggcgtat ggtgatctct 1564 
Thr Gly Arg Ala 

470 ■ 

agaaaacaga catagectac tggaaatatc gacgtecaaa caataatttt aaagactatt 1624 
tttctgcgta aaaaaaaaaa aaa^aaaa 1652 



<210> 2 
<211> 469 

<212> PRT 

<213> Phaeodactylum tricornutuin 
<400> 2 ! - ■ 

Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala Val 
1 5 .10 15 

Ala Lys His Asn Ala Ala Thr lie Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys lie Asp Gly lie lie Tyr 
35 40 45 



Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr lie Lys Met Phe 



50 55 60' 

Gly Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr.His 
65 70 .75 80 

Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val Thr Asp 

85 90 95 

Phe Val Cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 110 

Arg Glu Val Phe Lys He Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
115 120 125 

Gly Trp Phe Phe Arg Ala Phe Cys Tyr He Ala He Phe Phe Tyr Leu 
130 . 135 140 

Gin Tyr His Trp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala Val Ala 
145 150 155 160 

Tyr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala 
165 170 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly 
180 185 190 

Leu Gly Ala Asp Phe He Gly Gly Ser Lys Tirp Leu Trp Gin Glu Gin 
195 2.00 205 ' 

His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 235 240 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 
245 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265- 270 

Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
275 280 • 285 

Asn Ala Phe He His Ser Arg Arg Lys Tyr Ala Val Phe Trp Arg Ala 
290 295 300 

Val Tyr He Ala Val Asn Val He Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 320 

Leu Glu Trp Ser Trp Arg Val Phe Gly Asn He Met Leu Met Gly Val 
325 330 335 

Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu' Ser His Asn Phe 
340 345 350 



Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 
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Pro Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly 
370 375 - 380 

Gly Phe Leu Ser Gly Cys P3ae Thr Gly Gly Leu Asn Phe Gin Val Glu 
385 390 395 400 

His His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr lie Ala 
405 410 415 

Pro Lys Val Arg Glu He Cys Ala Lys His Gly Val His Tyr Ala Tyr 
420 425 430 

Tyr Pro Trp He His Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
, 435 440 445 

Ala Ala Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro 
450 455 460^ 

Leu Thr Gly Arg Ala 
465 



<210> 3 
<211> 1434 
<212> DNA 

<213> Phaeodactylum tricomutum 

<220> 

<221> CDS 

<222> {1)..(1434) 

<400> 3 . 

atg ggc aaa gga ggg gac get egg gcc teg aag ggc tea acg gcg get 48 
Met Gly Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr Ala Ala 

1 . 5 • . ^ . 10 - 15 ' 

cgc aag ate agt tgg cag gaa gte aag aee cac geg tet e eg gag gac 96 
Arg Lys He Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asp 
20 25 30 

gcc tgg ate att cac tec aat aag gte tae gac gtg tee aac tgg cac 144 
Ala Trp He He His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 
35 40 45 

gaa cat cce gga ggc gee gte att ttc acg cac gcc ggt gac gac atg 192. 
Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly Asp Asp Met 
50 55 60 

acg gac att ttc get gee ttt cac gea cec gga teg cag teg etc atg 240 
Thr Asp He Phe Ala Ala Phe His Ala Pro Gly Ser Gin Ser Leu Met 

65 70 .75 , 80 

aag aag ttc tac att ggc gaa ttg etc ccg gaa ace ace ggc aag gag 288 
Lys Lys Phe Tyr He Gly Glu Leu Leu Pro Glu Thr Thr Gly Lys Glu 

85 90 95 



ccg cag caa ate gcc ttt gaa aag ggc tac cgc gat ctg cgc tee aaa 33 6 



Pro Gin Gin lie Ala Plie Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 
100 105 110 

etc ate atg atg ggc atg ttc aag tec aac aag tgg ttc tac gtc tac 384 
Leu He Met Met Gly Met P3ae Lys Ser Asn Lys Trp Phe Tyr Val Tyr 
115 120 125 

aag tgc etc age aac atg gee att tgg gee gee gee tgt get etc gte 432 
Lys Cys Leu Ser Asn Met Ala He Trp Ala Ala Ala Cys Ala Leu Val 
130 135 140 

ttt tac teg gac cgc ttc tgg gta cac ctg gcc age gee gtc atg ctg 480 
Plie Tyr Ser Asp Arg Phe Ti^p Val His Leu Ala Ser Ala Val Met Leu 

145 150 155 160 

gga aca ttc ttt eag eag teg gga tgg ttg gca cac gac ttt ctg cac 528 
Gly Thr Phe Phe Gin Gin Ser Gly Trp Leu Ala His Asp Phe Leu His 
165 170 175 

cac eag gtc ttc ace aag cgc aag cac ggg gat etc gga gga etc ttt 576 
His Gin Val Phe Thr Lys Arg Lys His Gly Asp Leu Gly Gly Leu Ph.e 
180 185 190 

tgg Q'gg aae etc atg eag ggt tac tec gta eag tgg tgg aaa aac aag 624 
Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 
195 200 205 

cac aac gga cac cac gee gte ecc aac etc cac tgc tec tec gca gtc 672 . 
His Asn Gly His His Ala Val Pro /Asn Leu His Cys Ser Ser Ala Val 
210 ' 215 . ' 220 

geg caa gat ggg gac ceg gac ate gat ace atg ecc ett etc gee tgg 720 
Ala Gin Asp Gly Asp Pro Asp He Asp Thr Met Pro Leu Leu Ala Trp 
225 230 235 240 

tec gtc eag caa gee eag tct tac egg gaa etc caa gee gac gga aag 768 
Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Asp Gly Lys 
245 250 255 

gat teg ggt ttg gtc aag ttc atg ate egt aac caa tec tac ttt tac 816 
Asp Ser Gly Leu Val Lys Phe Met lie Arg Asn Gin Ser Tyr Phe Tyr 
260 265 270 

ttt ecc ate ttg ttg etc gee cgc ctg teg tgg ttg aac gag tec ttc 864 
Phe Pro He Leu Leu Leu Ala Arg Leu Ser . Trp Leu Asn Glu Ser Phe 
275 2 80 285 

aag tgc gee ttt ggg ett gga get geg teg gag aac get get etc gaa 912 
Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala Leu Glu 
290 295 300 

etc aag gee aag ggt ett eag tac ecc ett ttg gaa aag get ggc ate 9 60 
Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu Glu Lys Ala Gly He 
305 310 315 ^ 320 

ctg ctg cac tac get tgg atg ett aca gtt teg tec ggc ttt gga cgc 1008 
Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Gly Phe Gly Arg 
325 - 330 335 
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ttc teg ttc gcg tac acc gca ttt tac ttt eta acc gcg acc gcg tec 1056 
Phe Ser Phe Ala Tyr Tlir Ala Piie Tyr Phe Leu Thr Ala Thr Ala Ser 
340 345 350 

tgt gga ttc ttg etc gee att gte ttt ggc etc ggc cac aac ggc atg 1104 
Cys Gly Phe Leu Leu Ala He Val Phe Gly Leu Gly His Asn Gly Met 
355 ' 360 365 

^. 

gee acc tac aat gee gae gee cgt ecg gae ttc tgg aag etc caa gtc 1152 
Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 
370 375 ^ 380 

acc acg act ege aac gte aeg ggc gga cac ggt ttc ccc caa gee ttt 1200 
Thr Thr J, Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro Gin Ala Phe 
385 390 395 400 

gtc gae tgg ttc tgt ggt ggc etc cag tac caa gtc gae cac cac tta 1248 
Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin Val Asp His His Leu * 
405 410 415 

ttc ccc age etg ccc ega cac aat ctg gee aag aca cac gca ctg gtc 1296 
Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala Leu Val 
420 ^ 425 430 

gaa teg ttc tge aag gag tgg ggt gtc cag tac cac gaa gee gae ctt 1344 
Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu Ala Asp Leu 
435 440 445 

gtg gae ggg acc atg gaa gtc ttg cac eat ttg ggc age gtg gee ggc 1392 
Val Asp Gly Thr Met Glu Val Leu His His Leu Gly Ser Val Ala Gly 
450 455 460 

gaa ttc gtc gtg gat ttt gta cgc gat gga ccc gee atg taa 1434 
Glu Phe Val Val Asp Phe Val Arg Asp Gly Pro Ala Met 
465 470 475 



<210> 4 
<211> 477 
<212> PRT 

<213> Phaeodactylum tricomutum 
<400> 4 

Met Gly. Lys Gly Gly Asp Ala Arg Ala Ser Lys Gly Ser Thr Ala Ala 
1 5 . 10 • 15 

Arg Lys He Ser Trp Gin Glu Val Lys Thr His Ala Ser Pro Glu Asp 
20 25 30 

Ala Trp He He His Ser Asn Lys Val Tyr Asp Val Ser Asn Trp His 

35 ' 40 - 45 ' 

Glu His Pro Gly Gly Ala Val He Phe Thr His Ala Gly Asp Asp Met 
50 55 60 



Thr Asp He Phe Ala Ala Phe His Ala Pro Gly Ser Gin Ser Leu Met 
65 70 75 80 
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Lys Lys Phe Tyr lie Gly Glu Leu Leu Pro Glu Thx Thr Gly Lys Glu 

85 90 95 

Pro Gin Gin lie Ala Phe Glu Lys Gly Tyr Arg Asp Leu Arg Ser Lys 
100 105 110 

Leu lie Met Met Gly Met Ph.e Lys Ser Asn Lys Trp Phe Tyr Val Tyr 
115 120 125 

Lys Cys Leu Ser Asn Met Ala lie Trp Ala Ala Ala Cys Ala Leu Val 
130 ' 135 140 

Phe Tyr Ser Asp Arg Phe Trp Val His Leu Ala Ser Ala Val Met Leu 
145 150 ^ 155 160 

Gly Thr Phe Phe Gin Gin Ser Gly Trp Leu Ala His- Asp Phe Leu His 
165 ■ 170 175 

His Gin Val Phe Thr Lys- Arg Lys His Gly Asp Leu -Gly Gly Leu Phe 
180 185 190 

Trp Gly Asn Leu Met Gin Gly Tyr Ser Val Gin Trp Trp Lys Asn Lys 
195 200 205 

His Asn Gly His His Ala Val Vi^^o Asn Leu His Cys Ser Ser Ala Val 
210 215 - 220 

Ala Gin Asp Gly Asp Pro Asp He Asp Thr Met Pro Leu Leu Ala Trp 
225 , 230 235 240 

Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu Gin Ala Asp Gly Lys 
245 250 255 

Asp Ser Gly Leu Val Lys Phe Met He Arg Asn Gin Ser Tyr Phe Tyr 
260 265 -270 

Phe Pro He Leu Leu Leu Ala Arg Leu Ser Trp Leu Asn Glu Ser Phe 
275 280 285 

Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu Asn Ala Ala . Leu Glu 
290 295 . 300 

Leu Lys Ala Lys Gly Leu Gin Tyr- Pro Leu Leu Glu Lys Ala Gly He 
305 310 315 320 

Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser Ser Gly Phe Gly Arg 
325 330 335 

Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu Thr Ala Thr Ala Ser 
340 345 350 

Cys Gly Phe Leu Leu Ala He Val Phe Gly Leu Gly His Asn Gly Met 
■355 360 365 



Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe Trp Lys Leu Gin Val 
370 375 380 
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Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly Phe Pro Gin Ala Phe 
385 390 395 400 

Val Asp Trp Pile Cys Gly Gly Leu Gin Tyr Gin Val Asp His His Leu 
405 410 415 

Phe Pro Ser Leu Pro Arg His Asn Leu Ala Lys Thr His Ala Leu Val 
420 • 425 430 



Glu Ser Phe Cys Lys Glu Trp Gly Val Gin Tyr His Glu Ala Asp Leu 
435 440 445 

Val Asp Gly Thr Met Glu Val Leu His His Leu Gly Ser Val Ala Gly 
450 455 460 

Glu Phe Val Val Asp Phe Val Arg Asp Gly Pro Ala Met 

465 470 475 



<210> 5 
<211> 1651 
<212>"DNA 

<213> Phaeodactylum tricomutum 

<220> 

<221> CDS 

<222> (67) . . (1554) 

<400> 5 

gaagaaggaa catataaaag taagccatct cctcggcacc atctaaagac ctaatatcta 60 

ctcgtc atg gtt cgc ttt tea aca gcc get eta ctt tct ctg teg aca 108 
Met Val Arg Phe Ser Thr Ala Ala Leu Leu Ser Leu Ser Thr 
1 . 5 - 10 

ttg aea act tea tgt att ggt gee ttc eag ctg tct teg eca gca caa 156 
Leu Thr Thr Ser Cys lie Gly Ala Phe Gin Leu Ser Ser Pro Ala Gin 
15 20 25 30 • 

ctt ccg aca agt agg ctt cgt egg cat acg aac acg gcg ccg ctt teg 2 04 
Leu Pro Thr' Ser Arg Leu Arg Arg His Thr Asn Thr Ala Pro Leu Ser 

35 40 45 

gcc gtg gcc gtc gac tec ggt tct tee gat ccg gcc ttg gta ggc aac 252 
Aia Val Ala Val Asp Ser Gly Ser Ser Asp Pro Ala Leu Val Gly Asn 
50 55 * 60 

etc cec ctt ecc aac aac aat gat aat gag gac aag aac cgt aga atg 3 00 
Leu Pro Leu Pro Ash Asn Asn Asp Asn Glu Asp Lys Asn Arg Arg Met 
65 70 75 

eca atg atg gac ttg aaa ggt att get ctg tct ggt etc aaa ggg caa 348 
Pro Met Met Asp Leu Lys Gly lie Ala Leu Ser Gly Leu Lys Gly Gin 
80 85 90 



get ctt tec gtc cga gcg gaa gat ttt cct cag gcg aaa gac ttg cgt 
Ala Leu Ser Val Arg Ala Glu Asp Phe Pro Gin Ala Lys Asp Leu Arg 
95 100 105 110 



396 
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gcc gtc att ccg aaa gat tgc ttc gaa ccc gac acg gcc aaa teg ttg 444 
Ala Val lie Pro Lys Asp Cys Plie Glu Pro Asp Thr Ala Lys Ser Leu 
115 120 125 

gga tat ctt tec gtt tea act atg ggg aca att etc tgc tec gtc gtc 492 
Gly Tyr Leu Ser Val Ser Thr Met Gly Thr He Leu Cys Ser Val Val 
130 135 140 

ggc gcg aac etc ctt agt gtg etc gat ccc tec aat cca tta ace tgg 540 
Gly Ala Asn Leu Leu Ser Val Leu Asp Pro Ser Asn Pro Leu Thr Trp 
145 150 155 

ect etc tgg gcg gee tac ggt gee gtc acg ggg acg gtc gee atg ggg 588 
Pro Leu Trp Ala Ala Tyr Gly Ala Val Thr Gly Thr Val Ala Met Gly 
160 165 170 

ctt tgg gtg ctg gcc cac gaa tgc gga cac ggc gcc ttt tec aaa aac 636 
Leu Tirp Val Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys Asn 
175 180 185 190 

ega tee etc eag gat gee gtg ggg tae att ate cat tec ate atg ctg 684 
Arg Ser Leu Gin Asp Ala Val Gly Tyr He He His Ser He Met Leu 
195 200 205 

gtg cca tac ttt agt tgg eag cga teg cat gee gtg cat cac cag tat 732 
Val Pro Tyr Phe Ser Trp Gin Arg Ser His Ala Val His His Gin Tyr 
• 210 215 220 

ace aat eat atg gaa ctg ggg gaa aca cac gtt cct gat ega gee gat 780 
Thr Asn His Met Glu Leu Gly Glu Thr His Val Pro Asp Arg Ala Asp 
225 230 235 

aag gag ggc gag aag age ctg gcg etc cgc cag ttc atg ttg gat tec 82 8 
Lys Glu Gly Glu Lys - Ser Leu Ala Leu Arg Gin Phe Met Leu Asp Ser 
240 245 250 

ttt ggt aaa gac aag ggc atg- aaa gea tac gga ggc etc eag . teg ttt 876 
Phe Gly Lys Asp Lys Gly Met Lys Ala Tyr Gly Gly Leu Gin Ser Phe 
255 260 265 270 

ttg eat etc ate gtg gga tgg cca gee tac etc ctg ate ggt gcg ace 924 
Leu His Leu He Val Gly Trp Pro Ala Tyr Leu Leu He Gly Ala Thr 
275 280 285 

ggt gga ccc gac egt ggt atg ace aac cat ttt tat ccc aac cct ttg. 972 
Gly Gly Pro Asp Arg Gly Met Thr Asn His Phe Tyr Pro .Asn Pro Leu 
290 295 300 

teg acg cca aca cag ccc aag aaa gaa ctt ttc cct ggg aac tgg aaa 1020 
Ser Thr Pro Thr Gin Pro Lys Lys Glu Leu Phe Pro Gly Asn Trp Lys 

305 310 315 

gaa aag gtc tac eag tea gat att gga ate gee gcc gtt gtc ggc gcc 1068 
Glu Lys Val Tyr Gin Ser Asp He Gly He Ala Ala Val Val Gly Ala 
320 325 330 

etc att get tgg ace gcc act teg ggt eta gee ccc gtc atg gcc ttg 1116 
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Leu He Ala Trp Tiir Ala Thr Ser Gly Leu Ala Pro Val Met Ala Leu 
335 340 345 350 

tac ggt ggt ccc ttg ate gtc att aat gcc tgg ctg gta ctg tac acg 1164 
Tyr Gly Gly Pro Leu He Val He Asn Ala Trp Leu Val Leu Tyr Thr 
355 360 365 

tgg ttg caa cat aca gat acc gat gtt ccg cac- ttt tec tec gac aac 1212 
Trp Leu Gin His Thr Asp Thr Asp Val Pro His Phe Ser Ser Asp Asn 
370 375 380 

cac aac ttt gtc aag ggc gca ctg cat acg ate gat cgt ccc tac gac 1260 
His Asn Phe Val Lys Gly Ala Leu His Thr He Asp Arg Pro Tyr Asp 
385 390 395 

aaa ctt gat ccc tgg gga ate ata gac ttt ctg cac cac aag att gga 1308 
Lys Leu Asp Pro .Trp Gly He He Asp Phe Leu His His Lys He Gly 
400 405 ^ 410 

aca acg cat gtg gca cac cat ttt gac agt act ate ccc cac tat aag 1356 
Thr Thr His Val Ala His His Phe Asp Ser Thr He Pro His Tyr Lys 
415 • 420 425 430 

get cag att, get acc gat gcc ate aaa gcc aag ttt cca gaa gtg tac 1404 
Ala. Gin He Ala Thr Asp Ala He Lys Ala Lys Phe Pro Glu Val Tyr 
435 440 445 

etc tat gac ccg aca cca att cca caa gcc atg tgg egc gtc gcc aag 1452 
Leu Tyr Asp Pro Thr Pro He Pro Gin Ala Met .Trp Arg Val Ala Lys 
450 - i 455 460 

gga tgt act gca gta gag caa cgc ggt gac gcc tgg gtg tgg aaa aac 1500 
Gly Cys Thr Ala Val Glu Gin Arg Gly Asp Ala Trp Val' Trp Lys Asn 
.465 470 475 

. gaa gga iata gaa gat ttg gtg gaa cat cgt caa age aaa tta teg age 1548 
Glu Gly He Glu Asp Leu Val Glu His Arg Gin Ser Lys Leu Ser Ser 
480 I 485 490 

gaa taa agcaacatat cgctttatgg aagaacaaac gtceattgtg taaaaccctg 1604 

Glu 

495 ' , ' 

ataatttcaa tattgtgttt tgttttaaaa aaaaaaaaaa aaaaaaa 1651 



<210> 6 

<211> 495 ' 
<212> PRT 

<213> Phaeodactylum trieornutum 
<400> 6 

Met Val Arg Phe Ser Thr Ala Ala Leu Leu Ser Leu Ser Thr Leu Thr 
1 5 10 15 



Thr Ser Cys He Gly Ala Phe Gin Leu Ser Ser Pro Ala Gin Leu Pro 
20 25 30 
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Thr Ser Arg Leu Arg Arg His Thr Asn Thr Ala Pro Leu Ser Ala Val 
35 40 45 

Ala Val Asp Ser Gly Ser Ser Asp Pro Ala Leu Val Gly Asn Leu Pro 
50 55 60 

Leu Pro Asn Asn Asn Asp Asn Glu Asp Lys Asn Arg; Arg Met Pro Met 
65 70 75 80 

Met Asp Leu Lys Gly lie Ala Leu Ser Gly Leu Lys Gly Gin Ala Leu 

85 90 95 

Ser Val Arg Ala Glu Asp Phe Pro Gin Ala Lys Asp Leu Arg Ala Val 
100 . 105 110 

lie Pro Lys Asp Cys Phe Glu Pro Asp Thr Ala Lys Ser Leu Gly Tyr 
115 • 120 125 

Leu Ser Val Ser Thr Met Gly Thr lie Leu Cys Ser Val Val Gly Ala 
130 135 140 

Asn Leu Leu Ser Val Leu Asp Pro Ser Asn Pro Leu Thr Trp Pro Leu 
145 150 155 ' ■ 160 

Trp Ala Ala Tyr Gly Ala Val .Thr Gly Thr Val Ala Met' Gly Leu Trp 
165 170 175 

Val Leu Ala His Glu Cys Gly His Gly Ala Phe Ser Lys Asn Arg Ser 
180 ' . 185 190 

Leu Gin Asp Ala Val Gly Tyr lie lie His Ser lie Met Leu Val Pro 
195 200 205 

Tyr Phe Ser Trp Gin Arg Ser His Ala Val His His Gin Tyr Thr Asn 

210 - 215 220 

His Met Glu Leu Gly Glu Thr His Val Pro Asp Arg Ala Asp' Lys Glu 
225 230 235 240 

Gly Glu Lys Ser Leu Ala Leu Arg Gin Phe Met Leu Asp Ser Phe Gly 
245 250 255 . 

Lys Asp Lys Gly Met Lys Ala Tyr Gly Gly Leu Gin Ser Phe Leu His 
260 265 270 

Leu He Val Gly Trp Pro Ala Tyr Leu Leu He Gly Ala Thr Gly Gly 
275 280 285 

Pro Asp Arg Gly Met Thr Asn His Phe Tyr Pro Asn Pro Leu Ser Thr 
290 295 300 

Pro Thr Gin Pro Lys Lys Glu Leu Phe Pro Gly Asn Trp Lys Glu Lys 
305 310 315 320 

Val Tyr Gin Ser Asp He. Gly He Ala Ala Val Val Gly Ala Leu He 
325 330 335 



Ala Trp Thr Ala Thr Ser Gly Leu Ala Pro Val Met Ala Leu Tyr Gly 



340 



345 
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Gly Pro Leu lie Val lie Asn Ala Trp Leu Val Leu Tyr Tiir Trp Leu 
355 360 365 

Gin His Thr Asp Tlir Asp Val Pro His Phe . Ser Ser Asp Asn His Asn 
370 375 380 

Phe Val Lys Gly Ala Leu His Tlir lie Asp Arg'Pro Tyr Asp Lys Leu 
'385 ' 390 395 400 

Asp Pro Trp Gly lie lie Asp Phe Leu His His Lys lie Gly Thr Thr 
405 410 415 . 

•His Val Ala His His Phe Asp Ser Thr lie Pro His Tyr Lys Ala Gin 
420 - 425 • 430 

lie Ala Thr Asp Ala lie Lys Ala Lys Phe Pro Glu Val .Tyr Leu Tyr 
435 440 445 

Asp Pro Thr Pro lie Pro Glii Ala Met Trp Arg Val Ala Lys Gly Cys 

450 " 455 460 

Thr Ala Val Glu Gin Arg Gly Asp Ala Trp Val Trp Lys Asn Glu Gly 
465 470 475 480 

lie Glu Asp Leu Val Glu His Arg Gin Ser Lys Leu Ser Ser Glu 
485 490 495 



<210> 7 
<211> 1578 
<212> DNA 

<213> Physcomitrella patens . . 

<220> 

<221> CDS 

<222> (1) . . (1578) 

<400> 7 . 

atg gta ttc gcg ggc ggt gga ctt cag cag ggc tct etc gaa gaa aac 48 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 

1 ■ 5 10 . 15 

ate gac gtc gag cac att gcc agt atg tct etc ttc age gae ttc ttc 96 
lie Asp Val Glu His lie Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
20 25 .30 

agt tat gtg tct tea act gtt ggt teg tgg age gta cac agt ata caa 144 
Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser lie Gin 
35 40 '45 

cet ttg aag cgc etg aeg agt aag aag cgt gtt teg gaa age get gcc 192 
Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 55 60 

gtg caa tgt ata tea get gaa gtt cag aga aat teg agt ace cag gga 240 
Val Gin Cys lie Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
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65 70 75 80 

act gcg gag gca etc gca gaa tea gtc gtg aag ccc acg aga cga agg 288 

Tlir Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 

85 90 95 

tea tct cag tgg aag aag teg aca eac ecc eta tea gaa gta gca gta 336 
Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 

100 * 105 110 

cae aae aag cea age gat tge tgg att gtt gta aaa aae aag gtg tat 3 84 

His Asn Lys Pro Ser Asp Cys Trp lie Val Val Lys Asn Lys Val Tyr' 

115 120 125 

gat gtt tec aat ttt gcg gae gag cat ecc gga gga tea gtt att agt 432 

Asp Val Ser Asn Plie Ala Asp Glu His Pro Gly Gly Ser Val lie Ser 

130 ' 135 140 

act tat ttt gga cga gac ggc aca gat gtt ttc tct agt ttt cat gca 480 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 

145 150 155 160 

get tct aca tgg aaa att ett caa gac ttt tac att ggt gac gtg gag 528 

Ala Ser Thr Trp Lys lie Leu Gin Asp Phe Tyr lie Gly Asp Val Glu 

165 170 175 

agg gtg gag ecg act cca gag ctg ctg aaa gat ttc cga gaa atg aga 576 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 

180 185 190 

get ett ttc ctg agg gag caa ett ttc aaa agt teg aaa ttg tac tat 624 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 

195 200 205 

gtt atg aag ctg etc acg aat gtt get att ttt get gcg age att gca 672 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 

210 215 ' 220 

ata ata tgt tgg age aag act att tea gcg gtt ttg get tea get tgt 720 

He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 

225 230 235 240 

atg atg get ctg tgt ttc caa cag tgc gga tgg eta tee cat gat ttt 768 
Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 

245 250 255 

etc eac aat cag gtg ttt gag aca cgc tgg ett aat gaa gtt gtc ggg 816 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 

260 265 270 

tat gtg ate ggc aa,c gee- gtt ctg ggg ttt agt aca ggg tgg tgg aag 864 

Tyr Val He Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 

.275 280 285 

gag aag cat aae ett eat cat get get cca aat gaa tgc gat cag act • 912 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 

290 295 300 
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tac caa cca att gat gaa gat att gat act etc ccc etc att gcc tgg 960 
Tyr Gin Pro lie Asp Glu Asp lie Asp Tlir Leu Pro Leu lie Ala Trp 
305 310 315 320 

age aag gac ata ctg gcc aca gtt gag aat aag "aca ttc ttg cga ate ' 1008 
Ser Lys Asp lie Leu Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 335 

etc caa tac cag eat ctg ttc ttc atg ggt ctg tta ttt ttc gcc cgt 1056 
Leu Gin Tyr Gin His Leu Piie Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 350 

ggt agt tgg etc ttt tgg age tgg aga tat ace tct aca gca gtg etc 1104 
Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 365 

tea cet gte gac agg ttg ttg gag aag gga act gtt ctg ttt cac tac 1152 
Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370- 375 380 

ttt tgg ttc gte ggg aca gcg tge tat ctt etc cet ggt tgg aag cca 1200 
Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 400 

tta gta tgg atg gcg gtg act gag etc atg tec ggc atg ctg ctg gge 1248 
Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

ttt gta ttt gta ctt age cac aat ggg atg gag gtt tat aat teg tct 1296 
Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

aaa gaa ttc gtg agt gca cag 'ate gta tec aca egg gat ate aaa gga 1344 

Lys Glu Phe Val Ser .Aia Gin He Val Ser Thr Arg Asp He Lys Gly 
4^35 ' 440 445 

\ \ ^ " .. ' 

aac ata ttc aac gac tgg ttc act ggt ggc ctt aae agg caa ata gag 1392 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 

450 ■ 1 "'455 460 

eat cat ctt ttc cca aca atg ccc agg cat aat tta aae aaa ata gca 1440 
His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470', ! 475 480 

cet aga gtg gag gtg ttc tgt aag aaa cac ggt "ctg gtg tac gaa gac 1488 
Pro. Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

gta tct att get acc ggc act tge aag gtt ttg aaa gca ttg aag gaa 153 6 
Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 510 

gte gcg gag get gcg gca gag- cag cat get acc acc agt taa 1578 
Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
•515 520 525 



<210> 8 
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<211> 525 
<212> PRT 

<213> Physcoiuitrella patens 
<400> 8 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
.15 10 15 

lie Asp Val Glu His lie Ala Ser Met Ser Leu Phe Ser Asp Plie Phe 
20 25 30 

Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser lie Gin 
35 -40 45 

Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 55 60 

Val Gin Cys lie Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 70 75 80 

Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 

85 90 95 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 105 110 

His Asn Lys Pro Ser Asp Cys Tirp He Val Val Lys Asn Lys Val Tyr 
115 120 125 

Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
145 150 155 . 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 185 190 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 205 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 

He He Cys Tirp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 

Met Met Ala Leu Cys Phe Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 ■ 270 , 

Tyr Val He Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 285 
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Glu Lys His Asn Leu His His Ala Ala Pfo Asn Glu Cys Asp Gin Thr 
290 295 300 



Tyr Gin Pro He Asp Glu Asp He Asp Tlir Leu Pro Leu He Ala Trp 
305 310 315 320 

Ser Lys Asp He Leu Ala Tlir Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 -335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 . 350 

Gly Ser Trp Leu Phe Trp Ser Tarp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 375 380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 400 

Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

Lys Glu Phe Val Ser Ala Glh He Val Ser Thr Arg Asp He Lys Gly 

435 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
. 450 455 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470 475 480 

Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 510 

Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 520 525 



<210> 9 
<211> 873 
<212> DNA 

<213> Physcomitrella patens 



<220> 

<221> CDS 

<222> (1) . . (873) 



<400> 9 

atg gag gtc gtg gag aga ttc tac ggt gag ttg gat ggg aag gtc teg 



18 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
15 10 15 

cag ggc gtg aat gca ttg ctg ggt agt ttt ggg gtg gag ttg acg gat 96 
*Gln Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 25 30 

acg ccc act acc aaa ggc ttg ccc etc gtt gac agt ccc aca ccc ate 144 
Thr Pro Thr T3ar Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 

gtc etc ggt gtt tct gta tac ttg act att gtc att gga ggg ctt ttg 192 
Val Leu Gly Val Ser Val Tyr Leu Thr lie Val lie Gly Gly Leu Leu 
50 ' 55 60 

•tgg ata aag gcc agg gat ctg aaa ccg cgc gcc teg gag cea ttt ttg 240 
Trp lie Lys Ala Arg Asp Leu. Lys Pro Arg Ala Ser Glu Pro Phe Leu . 
♦65 . . 70 • 75 SO . 

etc caa get ttg gtg ctt gtg cae aac ctg tt'c tgt ttt gcg etc agt 288 
Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 

85. 90 .95 

ctg tat atg tgc gtg ggc ate get tat cag get att ace tgg egg tac 336 
Leu Tyr Met Cys Val Gly lie Ala Tyr Gin Ala lie Thr Trp Arg Tyr 
100 105 110 

tct etc tgg ggc aat gca tac aat cct aaa cat aaa gag atg gcg att 384 
Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala lie 

115 120 125 

ctg gta tac ttg ttc tac atg tct aag tac gtg gaa ttc atg gat ace 432 
Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 . 135 . 140 

gtt ate atg ata ctg aag cgc age acc agg caa ata age- ttc etc cac 480 
Val lie Met lie Leu Lys Arg Ser Thr" Arg Gin lie Ser Phe Leu His 
145 150 155 160 

gtt tat cat eat tct tea att tec etc att tgg tgg get att get eat 528 
Val Tyr His His Ser Ser lie . Ser Leu He Trp Trp Ala He Ala His 
165 170 175 

cac get cct ggc ggt gaa: gca tat tgg tct gcg get ctg aac tea gga 576 
His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185 190 

gtg cat gtt etc atg tat gcg tat "tac ttc ttg get gcc tgc ctt cga 624 
Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 

agt age cea aag tta aaa aat aag tac ctt ttt tgg ggc agg tac ttg 672 
Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

aca caa ttc caa atg ttc cag ttt atg ctg aac tta gtg cag get tac 720 
Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 
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tac gac atg aaa acg aat gcg cca tat cca caa tgg ctg ate aag att 768 
Tyr Asp Met Lys T3ar Asn Ala Pro Tyr Pro Gin Trp Leu lie Lys lie 
245 250 255 

ttg ttc tac tac atg ate teg ttg ctg ttt ctt ttc ggc aat ttt tac 816 
Leu Ph.e Tyr Tyr Met lie Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
260 265 270 • 

gta caa aaa tac ate aaa cec tct gac gga aag caa aag gga get aaa 864 
Val Gin Lys Tyr lie Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 

act gag tga 873 
Thr Glu 
290 



<210> 10 
<211> 290 
<212> PRT 

<213> Ptiyscomitrella patens 
<400> 10 ' 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 

.1 " 5 10 15 ' 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 25 30 

Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 

Val Leu Gly Val Ser Val Tyr Leu Thr He Val He Gly Gly Leu Leu 
50 - 55 60 

Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
65 70 75 80 

Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 

85 90 95 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
115 120 125 



Leu Val Tyr Leu Phe Tyr Met Ser 
130 135 

Val He Met He Leu Lys Arg Ser 
145 150 

Val Tyr His His Ser Ser He Ser 
165 ■ 

His Ala Pro Gly Gly Glu Ala Tyr 



Lys Tyr Val Glu Phe Met Asp Thr 
140 

Thr Arg Gin He Ser Phe Leu His 
155 160 

Leu He Trp Trp Ala He Ala His 
- 170 175 

Trp Ser Ala Ala Leu Asn Ser Gly 



180 



20 

185 



190 



Val His Val Leu Met Tyr Ala Tyr Tyr Plie Leu Ala Ala Cys Leu Arg 
195 200 205 . 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Plie Trp Gly Arg Tyr Leu 
210 215 220 

Thr Gin Phe Gin Met Phe Gin Plie Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

Tyr Asp Met Lys Ttir Asn Ala Pro Tyr. Pro Gin Trp Leu He Lys He 
245 250 • 255 

Leu Phe Tyr Tyr Met He Ser Leu Leu Plie Leu Phe Gly Asn Phe Tyr 
260 265 , 270 

Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 

Thr Glu 
290 



<210> 11 
<211> 1526 
<212> DNA 

<!213> Phaeodactylum tricomutum 

<220> 

<221> CDS 

<222> (92) . . (1402) 

<400> 11 . 

gcttccgtta gcgtcccata gtttgttaca cttggctgtg aaacgaatac gttcttggtc 60 

tacttactac aacgaagcaa ccaccagcag c atg- ggt aag gga ggt caa cga 112 

Met Gly Lys Gly Gly Gin Arg 
1 . 5 

get gta get ccc aag agtgcc acc age tct act ggc agt get acc ctt 160 
Ala Val Ala Pro Lys Ser Ala Thr Ser Ser Thr Gly Ser Ala Thr Leu 
10 15 20 

age caa age aag gaa eag gta tgg act teg teg tac aac ect ctg gcg 2 08 
Ser Gin Ser Lys Glu Gin Val Trp Thr Ser Ser Tyr Asn Pro Leu Ala 
25 30 35 

aag gat tec ecg gag ctg eca acc aaa ggc caa ate aag gee gtc att 256 
Lys Asp Ser Pro Glu Leu Pro Thr Lys Gly Gin He Lys Ala Val He 
40 45 50 ' . 55 . 

ccg aag gaa tgt ttc caa egc tea gee ttt tgg tct acc tte tac ctg 304 
Pro Lys Glu Cys Phe Gin Arg Ser Ala Phe Trp Ser Thr Phe Tyr Leu 

60 65 70 



atg egc gat etc gee atg get gee gee ttt tgc tac gga acc tea eag 
Met Arg Asp Leu Ala Met Ala Ala Ala Phe Cys Tyr Gly Thr Ser Gin 



352 



21 

75 80 85 

gtc etc tec acc gac ctt ccc caa gac gcc acg etc att ctg ccc tgg 400 
Val Leu Ser Thr Asp Leu Pro Gin Asp Ala Thr Leu lie Leu Pro Trp 
90 95 100 

get etc ggc tgg ggc gtc tac gcc ttt tgg atg gga acc att etc acc 448 
Ala Leu Gly Trp Gly Val Tyr Ala Phe Trp Met Gly Thr He Leu Thr 
105 110 115 

ggg ect tgg gta gtt gcg cac gaa tgt gga cae ggc get tac tec gac 49 6 
Gly Pro Trp Val Val Ala His Glu Cys Gly His Gly Ala Tyr Ser Asp 
120 . 125 130 135. 

tec eag acg ttc aat gac gtg gtc ggc ttt ate gtc cac caa get ttg 544 
Ser Gin Thr Phe Asn Asp Val Val Gly Phe He Val His' Gin Ala Leu 
140 145 150 

etc gtc ccc tac ttt gcc tgg eag tac acc cac gcg aaa cae cac cgt 592 
Leu Val Pro Tyr Phe Ala TiTp Gin Tyr Thr His Ala Lys His His Arg 
155 160 165 

cga acc -aac cat ctg gtg gac ggc gag tec cac gtc ect tct acc gcc 640 
Arg Thr Asn His Leu Val Asp Gly Glu Ser His Val Pro Ser Thr Ala 
170 175 180 

aag gat aac ggc etc ggg ccg cae aac gag cga aac tec ttc tac gcc 688 
Lys Asp Asn Gly Leu Gly Pro His Asn Glu Arg Asn Ser Phe Tyr Ala 
185 190 195 

gcg tgg cac gag gcc atg gga gac' ggc gcc ttt gcc gtc ttt caa gtc 73 6 
Ala Trp His Glu Ala Met Gly Asp Gly Ala Phe Ala Val Phe Gin Val 

200 205 210 215 - 

tgg teg cac ttg ttc gtc ggc tgg ect etc tac ttg gcc ggt ctg gcc 784 
Trp Ser His Leu Phe Val Gly Trp Pro Leu Tyr Leu Ala Gly Leu Ala 
220 225 230 

agt acc gga aag ctt gcg cac gaa ggt tgg tgg ctg gaa gaa egg aac 832 
Ser Thr Gly Lys Leu Ala His Glu Gly Trp Trp Leu Glu Glu Arg Asn 

235 240 245 

gcg att gcg gat cac ttt cga ccc age tct . ccc atg ttc ccc gcc aag 880 
Ala He Ala Asp His Phe Arg Pro Ser Ser Pro Met Phe P.ro Ala Lys 
250 255 260 

ate cgt gcc aag att gcc ctt tec age gcg acg gaa etc gcc gtg etc 928 
lie Arg Ala Lys He Ala Leu Ser Ser Ala Thr Glu Leu Ala Val Leu 
265 270 275 

get gga etc ttg tat gtc ggt aca eag gtc gga cac ctt ccc gtc ctg 976 
Ala Gly Leu Leu Tyr Val Gly Thr Gin Val Gly His Leu Pro Val Leu 
280 - 285 290 295 



ctg tgg tac tgg gga ccg tac acc ttt gtc aac get tgg ctt gta etc 
Leu Trp Tyr Trp Gly Pro Tyr Thr Phe Val Asn Ala Trp Leu Val Leu 
300 ' 305 310 



1024 
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tac acg tgg ctg cag cat acg gac ccg tec ate ccgcac tac ggt gaa 1072 

Tyr Thr Tzp Leu Gin His Thr Asp Pro Ser lie Pro His Tyr Gly Glu 
315 320 325 

ggc gag tgg acc tgg gtc aag ggc gcg etc tct acc att gat cga gac 1120 
Gly Glu Trp Thr Trp Val' Lys Gly Ala Leu Ser Thr lie Asp Arg Asp 
330 . 335 340 , 

tac ggc ate ttc gat ttc ttt cac cac acc ate ggt tec acg cae gtg 1168 
Tyr Gly lie Phe Asp Phe Phe His His Thr lie Gly Ser Thr His Val 
345 350 - 355 

gta cac cat ttg ttc cac gaa atg ccc tgg tac aat gee ggc att gcc 1216 
Val His His Leu Phe His Glu Met Pro Trp Tyr Asn Ala Gly lie Ala 
360 365 370 375 

acg caa aag gtc aag gaa ttt ttg gaa ccc cag ggc ttg tac aat tac 1264 
Thr Gin Lys Val Lys Glu Phe Leu Glu Pro Gin Gly Leu Tyr Asn Tyr 
380, 385 390 

gat ccg acc ccc tgg tac aag gcc atg tgg cgc att gcc egg acc tgt 1312 
Asp Pro Thr Pro Trp Tyr Lys Ala Met Trp Arg lie Ala Arg Thr Cys 
395 ' 400 '405 

cac tat gtg gag tea aac gag ggt gtg cag tat ttc aag agt atg gaa 1360 
His Tyr Val Glu Ser Asn Glu Gly Val Gin Tyr Phe Lys Ser Met Glu 
410 415 420 

aac gtg ccg ctg act aag gat gtg cga aac aaa gcc gca tga 1402 
Asn Val Pro Leu Thr Lys Asp Val Arg Asn Lys Ala Ala 
425 430 435 

gaaaaagtgc caccgacgca taattttaca atcctaccaa caagaccaac attatatggt 1462 

tttcgcttaa aagatagttt tttctaccat ctgtgtagtc ggcacaaaaa aaaaaaaaaa 1522 

aaaa 1526 



<210> 12 

<211> 43.6 

<212> PRT 

<213> Phaeodactylum tricoamutuici 

<400> 12 

Met Gly Lys Gly Gly Gin Arg Ala Val Ala Pro Lys Ser Ala Thr Ser 
1 5 10 15 . 

Ser Thr Gly Ser Ala Thr Leu Ser Gin Ser Lys Glu Gin Val Trp Thr 
20 * 25 ■ 30 

Ser Ser Tyr Asn Pro Leu Ala Lys Asp Ser Pro Glu Leu Pro Thr Lys 
35 40 45 

Gly Gin lie Lys Ala Val He Pro Lys Glu Cys Phe Gin Arg Ser Ala 
'50 55 60 



Phe Trp Ser Thr Phe Tyr Leu Met Arg Asp Leu Ala Met Ala Ala Ala 



65 



70 



23 

75 



80 



Phe Cys Tyr Gly Tlor 
.85 

Ala 1*hr Leu lie Leu 
100 

Trp Met Gly Thr lie 
115 

Gly His Gly Ala Tyr 
130 

Phe lie Val His Gin 
145 

Thr His Ala Lys His 
• 165 

Ser His Val Pro Ser 
180 



Ser Gin Val Leu Ser Thr 

90 

Pro Trp Ala Leu Gly Trp 
105 

Leu= Thr Gly Pro Trp Val 
120 

Ser Asp Ser Gin Thr Phe 
135 

Ala Leu Leu Val Pro Tyr 
150 155 

His Arg Arg Thr Asn His 
170 

Thr Ala Lys Asp Asn Gly 

'185 



Asp Leu Pro Gin Asp 
95 

Gly Val Tyr Ala Phe 
110 

Val Ala His Glu Cys 
125 

Asn Asp Val val Gly 
140 

Phe Ala Trp Gin Tyr 
160 

Leu Val Asp Gly Glu 
175 

Leu Gly Pro His Asn 

190 



Glu Arg Asn Ser Phe Tyr Ala Ala Trp His Glu Ala Met Gly Asp Gly 
195 200 205 

Ala Phe Ala Val Phe Gin Val Trp Ser His Leu Phe Val Gly Trp Pro 
210 215 220 

Leu Tyr Leu Ala Gly Leu Ala Ser Thr Gly Lys Leu Ala His Glu Gly 
225 230 235 240 



Trp Trp Leu Glu Glu Arg Asn Ala 
245 ' 

Ser Pro Met Phe Pro Ala Lys lie 
2 60 

Ala Thr Glu Leu Ala Val Leu Ala 
275 280 

Val Gly His Leu Pro- Val Leu Leu 
290 295 

Val Asn Ala Tarp Leu Val Leu Tyr 
305 310 

Ser He Pro His Tyr Gly Glu Gly 

325 

Leu Ser Thr He Asp Arg Asp Tyr 

- 340 

Thr. He Gly Ser Thr His Val Val 
355 360 

Trp Tyr Asn Ala Gly He Ala Thr 
370 375 



He, Ala Asp His Phe Arg Pro Ser 
. 250 255 

Arg Ala Lys He Ala Leu Ser Ser 
265 270 

Gly Leu Leu Tyr Val Gly Thr Gin 
285 

Trp Tyr Trp Gly Pro Tyr Thr Phe 
300 

Thr Trp Leu Gin His Thr Asp Pro 
315 320 

Glu Trp Thr Trp Val Lys Gly Ala 

330 335 

Gly -He Phe Asp Phe Phe His His 
345 350 

His His Leu Phe His Glu Met Pro 
365 

Gin Lys Val Lys Glu Phe Leu Glu- 
380 



24 



Pro Gin Gly Leu Tyr Asn Tyr Asp Pro Tlar Pro Trp Tyr Lys Ala Met 
385 390 395 400 

Trp Arg lie Ala Arg Tiir Cys His Tyr Val Glu Ser Asn Glu Gly Val 
405 410 415 

Gin Tyr Phe Lys Ser Met Glu Asn Val Pro Leu Thr Lys Asp Val Arg 
420 425 430 

,j Asn Lys Ala Ala 
435 



'<210> 13 
<211> 3598 
<212> DNA 
<213> Unknown 

<220> 

<223> Sequenz stellt eine pflanzliche 

Promotor-Terminator-Expressionskassette in Vektor 
pUC19 dar 



<400> 13 
tcgcgcgttt. 


cggtgatgac 


ggtgaaaacc 


tctgacacat 


gcagctcccg 


gagacggtca 


60 


cagcttgtct 


gtaagcggat 


gccgggagca 


gacaagcccg 


tcagggcgcg 


tcagcgggtg 


120 


ttggcgggtg 


tcggggctgg 


cttaactatg 


cggcatcaga 


gcagattgta 


ctgagagtgc 


180 


accatatgcg 


gtgtgaaata 


ccgcacagat 


gcgtaaggag 


aaaataccgc 


atcaggcgcc 


240 


attcgccatt 


caggctgcgc 


aactgttggg 


aagggcgatc 


ggtgcgggcc 


tcttcgctat 


300 


tacgccagct 


ggcgaaaggg 


ggatgtgctg 


caaggcgatt 


aagttgggta 


acgccagggt 


3 60 


tttcccagtc 


acgacgttgt 


aaaacgacgg 


ccagtgaatt 


cggcgcgccg 


agctcctcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt 


gttttactat 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt 


tataacacct 


540 , 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600* 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


g'gaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg 


catgtagtct 


1020 



25 



atataatgag 


gattttgcaa 


tactttcatt 


catacacact 


cactaagttt 


tacacgatta 


1080 


taatttcttc 


atagccagcc 


caccgcggtg 


ggcggccgcc 


tgcagtctag 


aaggcctcct 


1140 


gctttaatga 


gatatgcgag 


acgcctatga 


tcgcatgata 


tttgctttca 


attctgttgt 


1200 


gcacgttgta 


aaaaacctga 


gcatgtgtag 


ctcagatcct 


taccgccggt 


ttcggttcat 


1260 


tctaatgaat 


atatcacccg 


ttactatcgt 


atttttatga 


ataatattct 


ccgttcaatt 


1320 


tactgattgt 


ccgtcgacga 


attcgagctc 


ggcgcgccaa 


gcttggcgta 


atcatggtca 


1380 


tagctgtttc 


ctgtgtgaaa 


ttgttatccg 


ctcacaattc 


cacacaacat 


acgagccgga 


1440 


agcataaagt 


gtaaagcctg 


gggtgcctaa 


tgagtgagct 


aactcacatt 


aattgcgttg 


1500 


cgctcactgc 


ccgctttcca 


gtcgggaaac 


ctgtcgtgcc 


agctgcatta 


atgaatcggc 


1560 


caacgcgcgg 


ggagaggcgg 


tttgcgtatt 


gggcgctctt 


ccgcttcctc 


gctcactgac 


1620 


tcgctgcgct- 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


ggcggtaata 


1680 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


aggccagcaa 


1740 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


ccgcccccct 


1800 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


aggactataa 


1860 


agataccagg 


cgtttccGcc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


gaccctgccg 


1920 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttc 


tcatagctca 


1980 


cgctgtaggt 


atctcagttc 


ggtgtaggtc 


gttcgctcca 


agctgggctg 


tgtgcacgaa 


2040 


ccccccgttc 


agcccgaccg 


ctgcgcctta 


tccggtaact 


atcgtcttga 


gtccaacccg 


2100 


gtaagacacg 


.acttatcgcc 


actggcagca 


gccactggta 


acaggattag 


cagagcgagg 


2160 


tatgtaggcg 


gtgctacaga 


gttcttgaag 


tggtggccta 


actacggcta 


cactagaagg 


2220 


acagtatttg 


gtatctgcgc 


tctgctgaag 


ccagttacct 


tcggaaaaag 


agttggtagc 


2280 


tcttgatccg 


gcaaacaaac 


caccgctggt 


agcggtggtt 


tttttgtttg 


caagcagcag 


2340 


attacgcgca 


gaaaaaaagg 


atctcaajgaa 


gatcctttga 


tcttttctac 


ggg'gtctgac 


2400 


gctcagtgga 


acgaaaactc 


acgttaaggg 


attttggtca 


tgagattatc 


aaaaaggatc 


2460 


ttcacctaga 


tccttttaaa 


ttaaaaatga 


agttttaaat 


caatctaaag 


tatatatgag 


2520 


taaacttggt 


ctgacagtta 


ccaatgctta 


atcagtgagg 


cacctatctc 


agcgatctgt 


2580 


ctatttcgtt 


catccatagt 


tgcctgactc 


cccgtcgtgt 


agataactac 


gatacgggag 


2640 


ggcttaccat 


ctggccccag 


tgctgcaatg 


ataccgcgag 


acccacgctc 


accggctcca 


2700 


gatttatcag 


caataaacca 


gccagccgga 


agggccgagc 


gcagaagtgg 


tcctgcaact 


2760 



26 



ttatccgcct 


ccatccagtc 


tattaattgt 


tgccgggaag 


ctagagtaag 


tagttcgcca 


2820 


gttaatagtt 


tgcgcaacgt 


tgttgccatt 


gctacaggca 


tcgtggtgtc 


acgctcgtcg 


2880 


tttggtatgg 


cttcattcag 


ctccggttcc 


caacgatcaa 


ggcgagttac 


atgatccccc 


2940 


atgttgtgca 


aaaaagcggt 


tagctccttc 


ggtcctccga 


tcgttgtcag 


aagtaagttg 


3000 


gccgcagtgt 


tatcactcat 


ggttatggca 


gcactgcata 


attctcttac 


tgtcatgcca 


3060 


tccgtaagat 


gcttttctgt 


gactggtgag 


tactcaacca 


agtcattctg 


agaatagtgt 


3120 


atgcggcgac 


cgagttgctc 


ttgcccggcg 


tcaatacggg 


ataataccgc. 


.gccacatagc 


3180 


agaactttaa 


aagtgctcat 


cattggaaaa 


cgttcttcgg 


ggcgaaaact 


ctcaaggatc 


3240 


ttaccgctgt 


tgagatccag 


ttcgatgtaa 


cccactcgtg 


cacccaactg 


atcttcagca 


3300 


tcttttactt 


tcaccagcgt 


ttctgggtga 


gcaaaaacag 


gaaggcaaaa 


tgccgcaaaa 


3360 


aagggaataa 


gggcgacacg 


gaaatgttga 


atactcatac 


tcttcctttt 


tcaatattat 


3420 


tgaagcattt 


atcagggtta 


ttgtctcatg 


agcggataca 


tatttgaatg 


tatttagaaa 


3480 


aataaacaaa 


taggggttcc 


gcgcacattt 


ccccgaaaag 


tgccacctga 


cgtctaagaa 


3540 


accattatta 


tcatgacatt 


aacctataaa 


aataggcgta 


tcacgaggcc 


ctttcgtc 


3598 



<210> 14 
<211> 3590 
<212> DNA 
<213> Un3aiown 

<220> 

<223> Sequenz stellt eine pflanzliche 

Promotor-Terminator-Expressionskassette in Vektor 
pUC19 dar 

<400> 14 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 3 00 
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cggcgcgccg agctcctcga 420 
gcaaatttac acattgccac taaacgtcta aacccttgta atttgttttt gttttactat 480 
gtgtgttatg tatttgattt gcgataaatt tttatatttg gtactaaatt tataacacct 540 
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tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 'gcatgaacgt 


cacgtggaca 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900. 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg 


catgtagtct 


1020 


atataatgag 


gattttgcaa 


tactttcatt 


catacacact 


cactaagttt 


tacacgatta 


1080 


taatttcttc 


atagccagcg 


gatccgatat 


cgggcccgct 


agcgttaacc 


ctgctttaat 


1140 


gagatatgcg 


agacgcctat 


gatcgcatga 


tatttgcttt 


caattctgtt 


gtgcacgttg 


1200 


taaaaaacct 


gagcatgtgt 


agctcagatc 


cttaccgccg 


gtttcggttc 


attctaatga 


1260 


atatatcacc 


cgttactatc 


gtatttttat 


gaataatatt 


ctccgttcaa 


tttactgatt 


1320 


gtccgtcgac 


gaattcgagc 


tcggcgcgcc 


aagcttggcg 


taatcatggt 


catagctgtt 


1380 


tcctgtgtga 


aattgttatc 


cgctcacaat 


tccacacaac 


atacgagccg 


gaagcataaa 


1440 


gtgtaaagcc 


tggggtgcct 


aatgagtgag 


ctaactcaca 


ttaattgcgt 


tgcgctcact 


1500 


gcccgctttc 


cagtcgggaa 


acctgtcgtg 


ccagctgcat 


taatgaatcg 


gccaacgcgc 


1560 


ggggagaggc 


ggtttgcgta 


ttgggcgctc 


ttccgcttcc 


tcgctcactg 


actcgctgcg 


1620 


Gtcggtcgtt 


cggctgcggc 


gagcggtatc 


agctcactca 


aaggcggtaa 


tacggttatc 


1680 


cacagaatca 


ggggataacg 


caggaaagaa 


catgtgagca 


aaaggccagc 


aaaaggccag 


1740 


gaaccgtaaa 


aaggccgcgt 


tgctggcgtt 


tttccatagg 


ctccgccccc 


ctgacgagca 


1800 


tcacaaaaat 


cgacgctcaa 


gtcagaggtg 


gcgaaacccg 


acaggactat 


aaagatacca 


1860 


ggcgtttccc 


cctggaagct 


ccctcgtgcg 


ctctcctgtt 


ccgaccctgc 


cgcttaccgg 


1920 


atacctgtcc 


gcctttctcc 


cttcgggaag 


cgtggcgctt 


tctcatagct 


cacgctgtag 


1980 


gtatctcagt 


tcggtgtagg 


tcgttcgctc 


caagctgggc 


tgtgtgcacg 


aaccccccgt 


2040 


tcagcccgac 


cgctgcgcct 


tatccggtaa 


ctatcgtctt 


gagtccaacc 


cggtaagaca 


2100 


cgacttatcg 


ccactggcag 


cagccactgg 


taacaggatt 


agcagagcga 


ggtatgtagg 


2160 


cggtgctaca 


gagttcttga 


agtggtggcc 


taactacggc 


tacactagaa 


ggacagtatt 


2220 


tggtatctgc 


gctctgctga 


agccagttac 


cttcggaaaa 


agagttggta 


gctcttgatc 


2280 
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cggcaaacaa 


accaccgctg 


gtagcggtgg 


tttttttgtt 


tgcaagcagc 


agattacgcg 


2340 


cagaaaaaaa 


ggatctcaag 


aagatccttt 


gatcttttct 


acggggtctg 


acgctcagtg 


2400 


gaacgaaaac 


tcacgttaag 


ggattttggt 


catgagatta 


tcaaaaagga 


tcttcaccta 


2460 


gatcctttta 


aattaaaaat 


gaagttttaa 


atcaatctaa 


agtatatatg 


agtaaacttg 


2520 


gtctgacagt 


taccaa.tgct 


taatcagtga 


ggcacctatc 


tcagcgatct 


gtctatttcg 


2580 


ttcatccata 


gttgcctgac 


tccccgtcgt 


gtagataact 


acgatacggg 


agggcttacc 


2640 


atctggcccc 


agtgctgcaa 


tgataccgcg 


agacccacgc 


tcaccggctc 


cagatttatc 


2700 


agcaataaac 


cagccagccg 


gaagggccga 


gcgcagaagt 


ggtcctgcaa 


ctttatccgc 


2760 


ctccatccag 


tctattaatt 


gttgccggga 


agctagagta 


agtagttcgc 


cagttaatag 


2820 


tttgcgcaac 


gttgttgcca 


ttgctacagg 


catcgtggtg 


tcacgctcgt 


cgtttggtat 


2880 


ggcttcattc 


agctccggtt 


cccaacgatc 


aaggcgagtt 


acatgatccc 


ccatgttgtg 


2940 


caaaaaagcg 


gttagctcct 


tcggtcctcc 


gatcgttgtc 


agaagtaagt 


tggccgcagt 


3000 


gttatcactc 


atggttatgg 


cagcactgca 


taattctctt 


actgtcatgc 


catccgtaag 


3060 


atgcttttct 


gtgactggtg 


agtactcaac 


caagtcattc 


tgagaatagt 


gtatgcggcg 


3120 


accgagttgc 


tcttgcccgg 


cgtcaatacg 


ggataatacc 


gcgccacata 


gcagaacttt 


3180 


aaaagtgctc 


atcattggaa 


aacgttcttc 


ggggcgaaaa 


ctctcaagga 


tcttaccgct 


3240 


gttgagatcc 


agttcgatgt 


aacccactcg 


tgcacccaac 


tgatcttcag 


catcttttac 


3300 


tttcaccagc 


gtttctgggt 


gagcaaaaac 


aggaaggcaa 


aatgccgcaa 


aaaagggaat 


3360 


aagggcgaca 


cggaaatgtt 


gaatactcat 


actcttcctt 


tttcaatatt 


attgaagcat 


3420 


ttatcagggt 


tattgtctca 


tgagcggata 


catatttgaa 


tgtatttaga 


aaaataaaca 


3480 


aataggggtt 


ccgcgcacat 


ttccccgaaa 


agtgccacct 


gacgtctaag 


aaaccattat 


3540 


tatcatgaca 


ttaacctata 


aaaataggcg 


tatcacgagg 


ccctttcgtc 




3590 



■<210> 15 \"' ; 

<211> 3584 
<212> DNA 

<213> Uiaknown ' T "\ 

<220> 

<223> Sequenz stellt eine pflanzliche 

Promotor-Teaaninator-Expressionskassette in Vektor 
PUC19 dar* 

<400> 15 

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 
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cagcttgtct 


gtaagcggat 


gccgggagca 


gacaagcccg 


tcagggcgcg 


tcagcgggtg 


120 


ttggcgggtg 


tcggggctgg 


cttaactatg 


cggcatcaga 


gcagattgta 


ctgagagtgc 


180 


accatatgcg 


gtgtgaaata 


ccgcacagat 


gcgtaaggag 


aaaataccgc 


atcaggcgcc 


240 


attcgccatt 


caggctgcgc 


aactgttggg 


aagggcgatc 


ggtgcgggcc 


tcttcgctat 


300 


tacgccagct 


ggcgaaaggg 


ggatgtgctg 


caaggcgatt 


aagttgggta 


acgccagggt 


360 


tttcccagtc 


acgacgttgt 


aaaacgacgg 


ccagtgaatt 


cggcgcgccg 


agctcctcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt 


gttttactat 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt 


tataacacct 


540 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga 


tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacaccaa 


acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca . 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gttaccacac 


a.caagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg 


catgtagtct 


1020 


atataatgag 


gattttgcaa 


tactttcatt 


catacacact 


Cjactaagttt 


tacacgatta 


1080 


taatttcttc 


atagccagca 


gatctgccgg 


catcgatccc 


gggccatggc 


ctgctttaat 


1140 


gagatatgcg 


agacgcctat 


gatcgcatga 


tatttgcttt 


caattctgtt 


gtgcacgttg 


1200 


taaaaaacct 


gagcatgtgt 


agctcagatc 


cttaccgccg 


gtttcggttc 


attctaatga 


1260 


atatatcacc 


cgttactatc 


gtatttttat 


gaataatatt 


ctccgttcaa 


tttactgatt 


1320 


gtccgtcgac 


gagctcggcg 


cgccaagctt 


ggcgtaatca 


tggtcatagc 


tgtttcctgt 


1380 


gtgaaattgt 


tatccgctca 


caattccaca 


caacatacga 


gccggaagca 


taaagtgtaa 


1440 


agcctggggt 


gcctaatgag 


tgagctaact 


cacattaatt 


gcgttgcgct 


cactgcccgc 


1500 


tttccagtcg 


ggaaacctgt 


cgtgccagct 


gcattaatga 


atcggccaac 


gcgcggggag 


1560 


aggcggtttg 


cgtattgggc 


gctcttccgc 


ttcctcgctc 


actgactcgc 


tgcgctcggt 


1620 


cgttcggctg 


cggcgagcgg 


tatcagctca 


ctcaaaggcg 


gtaatacggt 


tatccacaga 


1680 


atcaggggat 


aacgc^ggaa 


agaacatgtg 


agcaaaaggc 


cagcaaaagg 


ccaggaaccg 


1740 


taaaaaggcc 


gcgttgctgg 


cgtttttcca 


taggctccgc 


ccccctgacg 


agcatcacaa 


1800 
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aaatcgacgc 


tcaagtcaga 


ggtggcgaaa 


cccgacagga 


ctataaagat 


accaggcgtt 


1860 


tccccctgga 


agctccctcg 


tgcgctctcc 


tgttccgacc 


ctgccgctta 


ccggatacct 


1920 


gtccgccttt 


ctcccttcgg 


gaagcgtggc 


gctttctcat 


agctcacgct 


gtaggtatct 


1980 


cagttcggtg 


taggtcgttc 


gctccaagct 


gggctgtgtg 


cacgaacccc 


ccgttcagcc 


2040 


cgaccgctgc 


gccttatccg 


gtaactatcg 


tcttgagtcc 


aacccggtaa 


gacacgactt 


2100 


atcgccactg 


gcagcagcca 


ctggtaacag 


gattagcaga 


gcgaggtatg 


taggcggtgc 


2160 


tacagagttc 


ttgaagtggt 


ggcctaacta 


cggctacact 


agaaggacag 


tatttggtat 


2220 


ctgcgctctg 


ctgaagccag 


ttaccttcgg 


aaaaagagtt 


ggtagctctt 


gatccggcaa 


2280 


acaaaccacc 


gctggtagcg 


gtggtttttt 


tgtttgcaag 


cagcagatta 


cgcgcagaaa 


2340 


aaaaggatct 


caagaagatc 


ctttgatctt 


ttctacgggg 


tctgacgctc 


agtggaacga 


2400 


aaactcacgt 


taagggattt 


tggtcatgag 


attatcaaaa 


aggatcttca 


cctagatcct 


2460 


tttaaattaa 


aaatgaagtt 


ttaaatcaat 


ctaaagtata 


tatgagtaaa 


cttggtctga 


2520 


cagttaccaa 


* tgcttaatca 


gtgaggcacc 


tatctcagcg 


atctgtctat 


ttcgttcatc 


2580 


catagttgcc 


tgactccccg 


tcgtgtagat 


aactacgafea 


cgggagggct 


taccatctgg 


2640 


ccGcagtgct 


gcaatgatac 


cgcgagaccc 


acgctcaccg 


gctccagatt 


tatcagcaat 


2700 


aaaccagcca 


gccggaaggg 


ccgagcgcag 


aagtggtcct 


gcaactttat 


ccgcctccat 


2760 


ccagtctatt 


aattgttgcc 


gggaagctag 


agtaagtagt 


tqgccagtta 


atagtttgcg 


2820 


caacgttgtt 


gccattgcta 


caggcatcgt 


ggtgtcacgc 


tcgtcgtttg 


gtatggcttc 


2880 


attcagctcc 


ggttcccaac 


gatcaaggcg 


agttacatga 


tcccccatgt 


tgtgcaaaaa 


2940, 


agcggttagc 


tccttcggtc 


ctccgatcgt 


tgtcagaagt 


aagttggccg 


cagtgttatc 


3000 


actcatggtt 


atggcagcac 


tgcataattc 


tcttactgtc 


atgccatccg 


taagatgctt 


3060 


ttctgtgact 


ggtgagtact 


caaccaagtc 


attctgagaa 


tagtgtatgc 


ggcgaccgag 


3120 


ttgctcttgc 


ccggcgtcaa 


tacgggataa 


taccgcgcca 


catagcagaa 


ctttaaaagt 


3180 


gctcatcatt 


ggaaaacgtt 


cttcggggcg 


aaaactctca 


aggatcttac 


cgctgttgag 


3240 


atccagttcg 


atgtaaccca 


ctcgtgcacc 


caactgatct 


tcagcatctt 


ttactttcac 


3300 


cagcgtttct 


gggtgagcaa 


aaacaggaag 


gcaaaatgcc 


gcaaaaaagg 


gaataagggc 


3360 


gacacggaaa 


tgttgaatac 


tcatactctt 


cctttttcaa 


tattattgaa 


gcatttatca 


3420 


gggttattgt 


ctcatgagcg 


gatacatatt 


tgaatgtatt 


tagaaaaata 


aacaaatagg 


3480 


ggttccgcgc 


acatttcccc 


gaaaagtgcc 


acctgacgtc 


taagaaacca 


ttattatcat 


3540 



31 

gacattaacc tataaaaata ggcgtatcac gaggcccttt cgtc 3 584 

<210> 16 
<211> 4507 
<212> DNA 
<213> Unknown 

<220> ~ - - 

<223> Sequenz stellt eine pflanzliche 

Promotor-Tentiinator-Expressionskassette in Vektor 

pUC19 dar 

<400> 16 



tcgcgcgttt 


cggtgatgac 


ggtgaaaacc 


tctgacacat 


gcagctcccg 


gagacggtca 


60 


cagcttgtct 


gtaagcggat 


gccgggagca 


gacaagcccg 


tcagggcgcg 


tcagcgggtg 


120 


ttggcgggtg 


tcggggctgg 


cttaactatg 


cggcatcaga 


gcagattgta 


ctgagagtgc 


180 


accatatgcg 


gtgtgaaata 


ccgcacagat 


gcgtaaggag 


aaaataccgc 


atcaggcgcc 


240 


attcgccatt 


caggctgcgc 


aactgttggg 


aagggcgatc 


ggtgcgggcc 


tcttcgctat 


300 


tacgccagct 


ggcgaaaggg 


ggatgtgctg 


caaggcgatt 


aagttgggta 


acgccagggt 


3 60 


tttcccagtc 


acgacgttgt 


aaaacgacgg 


ccagtgaatt 


cggcgcgccg 


agctcctcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aacccttgta 


atttgttttt 


gttttactat 


480 


gtgtgttatg 


tatttgattt 


gcgataaatt 


tttatatttg 


gtactaaatt 


tataacacct 


540 


tttatgctaa 


cgtttgccaa 


cacttagcaa 


tttgcaagtt 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 


actggaaatg 


taaatatttg 


ctaatatttc 


660 


tactatagga 


gaattaaagt 


gagtgaatat 


ggtaccacaa 


ggtttggaga 


■tttaattgtt 


720 


gcaatgctgc 


atggatggca 


tatacacca:a 


acattcaata 


attcttgagg 


ataataatgg 


780 


taccacacaa 


gatttgaggt 


gcatgaacgt 


cacgtggaca 


aaaggtttag 


taatttttca 


840 


agacaacaat 


gttaccacac 


acaagttttg 


aggtgcatgc 


atggatgccc 


tgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaccatg 


acatccactt 


960 


ggaggatgca 


ataatgaaga 


aaactacaaa 


tttacatgca 


actagttatg 


catgtagtct 


1020 


atataatgag 


gattttgcaa 


tactttcatt 


catacacact 


cactaagttt 


tacacgatta 


1080 


taatttcttc 


atagccagcc 


caccgcggtg 


ggcggccgcc 


tgcagtctag 


aaggcctcct 


1140 


gctttaatga 


gatatgcgag 


acgcctatga 


tcgcatgata 


tttgctttca 


attctgttgt 


1200 


gcacgttgta 


aaaaacctga 


gcatgtgtag 


ctcagatcct 


taccgccggt 


ttcggttcat 


1260 


tctaatgaat 


atatcacccg 


ttactatcgt 


atttttatga 


ataatattct 


ccgttcaatt 


1320 
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tactgattgt 


ccgtcgagca 


aatttacaca 


ttgccactaa 


acgtctaaac 


ccttgtaatt 


1380 


tgtttttgtt 


ttactatgtg 


tgttatgtat 


ttgatttgcg 


ataaattttt 


atatttggta 


1440 


ctaaatttat 


aacacctttt 


atgctaacgt 


ttgccaacac 


ttagcaattt 


gcaagttgat 


1500 


taattgattc 


taaattattt 


ttgtcttcta 


aatacatata 


ctaatcaact 


ggaaatgtaa 


1560 


atatttgcta 


atatttctac 


tataggagaa 


ttaaagtgag 


tgaatatggt 


accacaaggt 


1620 


ttggagattt 


aattgttgca 


atgctgcatg 


gatggcatat 


acaccaaaca 


ttcaataatt 


1680 


cttgaggata 


ataatggtac 


cacacaagat 


ttgaggtgca 


tgaacgtcac 


gtggacaaaa 


1740 


ggtttagtaa 


tttttcaaga 


caacaatgtt 


accacacaca 


agttttgagg 


tgcatgcatg 


1800 


gatgccctgt 


ggaaagttta 


aaaatatttt 


ggaaatgatt 


tgcatggaag 


•ccatgtgtaa 


1860 


aaccatgaca 


tccacttgga 


ggatgcaata 


atgaagaaaa 


ctacaaattt 


acatgcaact 


1920 


agttatgcat 


gtagtctata 


taatgaggat 


tttgcaatac 


tttcattcat 


acacactcac 


1980 


taagttttac 


acgattataa 


tttcttcata 


gccagcggat 


ccgatatcgg 


gcccgctagc 


2040 


gttaaccctg 


ctttaatgag 


atatgcgaga 


cgcctatgat 


cgcatgatat 


ttgctttcaa 


2100 


ttctgttgtg 


cacgttgtaa 


aaaacctgag 


catgtgtagc 


tcagatcctt 


accgccggtt 


2160 


tcggttcatt 


ctaatgaata 


tatcacccgt 


tactatcgta 


tttttatgaa 


taatattctc 


2220 


cgttcaattt 


actgattgtc 


cgtcgacgaa 


ttcgagctcg 


gcgcgccaag 


cttggcgtaa 


2280 


tcatggtcat 


agctgtttcc 


tgtgtgaaat 


tgttatccgc 


tcacaattcG 


acacaacata 


2340 


cgagccggaa 


gcataaagtg 


taaagcctgg 


ggtgcctaat 


gagtgagcta 


actcacatta 


2400 


attgcgttgc 


gctcactgcc 


cgctttccag 


tcgggaaacc 


tgtcgtgcca^ 


gctgcattaa 


2460 


tgaatcggcc 


aacgcgcggg 


gagaggcggt 


ttgcgtattg 


ggcgctcttc 


cgcttcctcg 


2520 


ctcactgact 


cgctgcgctc 


ggtcgttcgg 


ctgcggcgag 


cggtatcagc 


tcactcaaag 


2580 


gcggtaatac 


ggttatccac 


agaatcaggg 


gataacgcag 


gaaagaacat 


gtgagcaaaa 


2640 


ggccagcaaa 


aggccaggaa 


ccgtaaaaag 


gccgcgttgc 


tggcgttttt 


ccataggctc 


2700 


cgcccccctg 


acgagcatca 


caaaaatcga 


cgctcaagtc 


agaggtggcg 


aaacccgaca 


2760 


ggactataaa 


gataccaggc 


gtttccccct 


ggaagctccc 


tcgtgcgctc 


tcctgttccg 


2820 


accctgccgc 


ttaccggata 


cct.gtccgcc 


tttctccctt 


cgggaagcgt 


ggcgctttct 


2880 


catagctcac 


gctgtaggta 


tctcagttcg 


gtgtaggtcg 


ttcgctccaa 


gctgggctgt 


2940 


gtgcacgaac 


cccccgttca 


gcccgaccgc 


tgcgccttat 


ccggtaacta 


tcgtcttgag 


3000 


tccaacccgg 


taagacacga 


cttatcgcca 


ctggcagcag 


ccactggtaa 


caggattagc 


3060 
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agagcgaggt 


atgtaggcgg 


actagaagga 


cagtatttgg 


gttggtagct 


cttgatccgg 


aagcagcaga 


ttacgcgcag 


gggtctgacg 


ctcagtggaa 


aaaaggatct 


tcacctagat 


atatatgagt 


aaacttggtc 


gcgatctgtc 


tatttcgtto 


atacgggagg 


gcttaccatc 


ccggctccag 


atttatcagc 


cctgcaactt 


tatccgcctc 


agttcgccag 


ttaatagttt 


cgctcgtcgt 


ttggtatggc 


tgatccccca 


tgttgtgcaa 


agtaagttgg 


ccgcagtgtt 


gtcatgccat 


ccgtaagatg 


gaatagtgta 


tgcggcgacc 


ccacatagca 


gaactttaaa 


tcaaggatct 


taccgctgtt 


tcttcagcat 


cttttacttt 


gccgcaaaaa 


agggaataag 


caatattatt 


gaagcattta 


atttagaaaa 


ataaacaaat 


gtctaagaaa 


ccattattat 


tttcgtc . 





<210> 17 
•<211> 5410 
<212> DNA 
<213> Unlcnown 



tgctacagag 


ttcttgaagt 


ggtggcctaa 


ctacggctac 


3120 


tatctgcgct 


ctgctgaagc 


cagttacctt 


cggaaaaaga 


3180 


caaacaaacc 


accgctggta 


gcggtggttt 


ttttgtttgc 


3240 


aaaaaaagga 


tctcaagaag 


atcctttgat 


cttttctacg 


3300 


cgaaaactca 


cgttaaggga 


ttttggtcat 


gagattatca 


3360 


ccttttaaat 


taaaaatgaa 


gttttaaatc 


aatctaaagt 


3420 


tgacagttac 


caatgcttaa 


tcagtgaggc 


acctatctca 


3480 


atccatagtt 


gcctgactcc 


Gcgtcgtgta 


gataactacg 


3540 


tggccccagt 


gctgcaatga 


taccgcgaga 


cccacgctca 


3600 


aataaaccag 


ccagccggaa 


gggccgagcg 


cagaagtggt 


3660 


catccagtct 


attaattgtt 


gccgggaagc 


tagagtaagt 


3720 


gcgcaacgtt 


gttgccattg 


ctacaggcat 


cgtggtgtca 


3780 


ttcattcagc 


tccggttccc 


aacgatcaag 


gcgagttaca 


3840 


aaaagcggtt 


agctccttcg 


gtcctccgat 


cgttgtcaga 


3900 


atcactcatg 


gttatggcag 


cactgcataa 


ttctcttact 


3960 


cttttctgtg 


actggtgagt 


actcaaccaa 


gtcattctga 


4020 


gagttgctct 


tgcccggcgt 


caatacggga 


taataccgcg 


4080 


agtgctcatc 


attggaaaac 


gttcttcggg 


gcgaaaactc 


4140 


gagatccagt 


tcgatgtaac 


ccactcgtgc 


acccaactga 


4200 


caccagcgtt 


tctgggtgag 


caaaaacagg 


aaggcaaaat 


4260 


ggcgacacgg 


aaatgttgaa 


tactcatact 


cttccttttt 


4320 


tcagggttat 


tgtctcatga 


gcggatacat 


atttgaatgt 


4380 


aggggttccg 


cgcacatttc 


cccgaaaagt 


gccacctgac 


4440 


catgacatta 


acctataaaa 


ataggcgtat 


cacgaggccc 


4500 
4507 



<220> 



34 

<223> Sequenz stellt eine pflanzliche 

Promotor-Terminator-Expressionskassette in Vektor 
PUC19 dar 



<400> 17 
ttttggaaat 


gafcttgcatg 


gaagccatgt 


gtaaaaeeat 


gaeateeaet 


t crcracrcra t crc 


60 


aataatgaag 


aaaacbacaa 


atfcfcacafccrc 


aae t agt tat 


crcatcrtaete 


tatataatcra 


120 


ggafctttgca 


atactttcat 


tcatacacac 


t eae t aagt t 


ttacaegatt 


ataatttefct 


180 


catagccagc 


ggatccgata 


tcgggcccgc 


tagegttaae 


cetgetttaa 


tgagatatge 


240 


gagacgccta 


tcratccfcatcf 


atatttgctt 


tcaattctgt 


tcrtcrcaccftt 


gt aaaaaac c 


300 


tcracrcatcrtcr 


t age tcaga t 


ccttaccgcc 


ggttteggtt 


eattetaatg 


aatatateae 


360 


ccgttacfcat 


cgtatttfcta 


tgaataatafc 


tctccgttca 


afcttactgafc 


tgfccegtcga 


420 


gcaaatttac 


acattgccac 


taaacgtcta 


aaeccttgta 


atttgttttt 


gttttaetat 


480 


crtcrtdttatcr 


tatttgattt 


gcgafcaaat t 


tttatatttg 


gtactaaatt 


tataacaect 


540 


ttfcatgctaa 


cgtfctgccaa 


cacfctagcaa 


1 1 1 ge aagt t 


gattaattga 


ttctaaatta 


600 


tttttgtctt 


ctaaatacat 


atactaatca 

^iM ^*#^«4>V^ W^MWf* wVi'^^ 


actcrcraaatcr 


fcaaatatfcfccr 


G taatafcttc 


660 


tactatagga 


gaat t aaagt 


gag t gaat at 


ggtaeeaeaa 


gg 1 1 1 ggaga 


tttaattCTtt 


720 


gcaa tgc t gc 


a fc crcra fc cf crc a 


fcafcacaccaa 


acattcaata 


attcfcfceacfcr 


a t aa fcaa t crcr 


780 


tzaccacacaa 


gat t tgaggt 


gcatgaacgt 


eaegtggaea 


aaagg 1 1 1 ag 


taafcttttca 


840 


agacaacaat: 


gttaccacac 


acaagttttg 


acre t ere at ere 


atggiatgece 


fcgtggaaagt 


900 


ttaaaaatat 


tttggaaatg 


atttgcatgg 


aagccatgtg 


taaaaeeatg 


acatccactt 


960 


crcracfcra fc crc a 


afcaafcgaaga 


aaactacaaa 


tttaeatgea 


aetagttatg 


catefcacrfcct 


1020 


a ti a tz aa ii gag 


gattttgcaa 


fcactfctcatt 


cataeacact 


cacfcaacrttfc 


tacaccratfca 


1080 


taatttcttc 


afcagccagca 


crate tcrcccrcr 


eatccrateee 


cTCTcrcc a tCTcre 


ctcrctfcfcaat 


1140 


gagatatgcg 


agacgcctafc 


gatcgcatga 


tatttgcttt 


eaattetgtt 


crfccrcaccrfctcr 


1200 


t aaaaaac c t 


gagcatgfcgfc 


age tc agate 


ettaeegecg 


gtttcggtte 


attctaatga • 


1260 


atatatcacG 


cgttactatG 


gtatttttat 


gaataatatt 


eteegtteaa 


tttactgatt 


1320 


gtccgtcgac 


gagctcggcg 


egeeaagetfc 


ggcgtaatca 


tggteatage 


tgtttcetgt 


1380 


gtgaaattgt 


tatccgctca 


caattccaca 


caacatacga 


gccggaagca 


taaagtgtaa 


1440 


agcctggggt 


gcctaatgag 


tgagetaaet 


eaeattaatt 


gegttgeget 


cactgecege 


1500 


tttccagtcg 


ggaaacctgfc 


egtgeeaget 


geattaatga 


ateggecaae 


gcgcggggag 


1560 


aggcggtttg 


cgtattgggc 


gctettecgc 


tteetegete 


aetgaetege 


tgcgctcggt 


1620 
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cgttcggctg 


cggcgagcgg 


tatcagctca 


ctcaaaggcg 


gtaatacggt 


tatccacaga 


1680 


atcaggggat 


aacgcaggaa 


agaacatgtg 


agcaaaaggc 


cagcaaaagg 


ccaggaaccg 


1740 


taaaaaggcc 


gcgttgctgg 


cgtttttcca 


taggctccgc 


ccccctgacg 


agcatcacaa 


1800 


aaatcgacgc 


tcaagtcaga 


ggtggcgaaa 


cccgacagga 


ctataaagat 


accaggcgtt 


1860 


tcGccctgga 


agctccctcg 


tgcgctctcc 


tgttccgacc 


ctgccgctta 


ccggatacct 


1920 


gtccgccttt 


ctcccttcgg 


gaagcgtggc' 


gctttctcat 


agctcacgct 


gtaggtatct 


1980 


cagttcggtg 


taggtcgttc 


gctccaagct 


gggctgtgtg 


cacgaacccc 


ccgttcagcc 


2040 


cgaccgctgc 


gccttatccg 


gtaactatcg 


tcttgagtcc 


aacccggtaa 


gacacgactt 


2100 


atcgccactg 


gcagcagcca 


ctggtaacag 


gattagcaga 


gcgaggtatg 


taggcggtgc 


2160 


tacagagttc 


ttgaagtggt 


ggcctaacta 


cggctacact 


agaaggacag 


tatttggtat 


2220 


ctgcgctctg 


ctgaagccag 


ttaccttcgg 


aaaaagagtt 


ggtagctctt 


gatccggcaa 


2280 


acaaaccacc 


gctggtagcg 


gtggtttttt 


tgtttgcaag 


cagcagatta 


cgcgcagaa.a 


2340 


aaaaggatct 


caagaagatc 


ctttgatctt 


ttctacgggg 


tctgacgctc 


agtggaacga 


2400 


aaactcacgt 


taagggattt 


tggtcatgag 


attatcaaaa 


aggatcttca 


cctagatcct 


2460 


tttaaattaa 


aaatgaagtt 


ttaaatcaat 


ctaaagtata 


tatgagtaaa 


cttggtctga 


2520 


cagttaccaa 


tgcttaatca 


gtgaggcacc 


tatctcagcg 


atctgtctat 


ttcgttcatc 


2580 


catagttgcc 


tgactcGccg 


tcgtgtagat 


aactacgata 


cgggagggct 


taccatctgg 


2640 


ccccagtgct 


gcaatgatac 


cgcgagaccc 


acgctcaccg 


gctccagatt 


tatcagcaat 


2700 


aaaccagcca 


gccggaaggg 


ccgagcgcag 


aagtggtcct 


gcaactttat 


ccgcctccat 


2760 


ccagtctatt 


aattgttgcc 


gggaagctag 


agtaagtagt 


tcgccagtta 


atiagtttgcg 


2820 


caacgttgtt 


gccattgcta 


caggcatcgt 


ggtgtcacgc 


tcgtcgtttg 


gtatggcttc 


2880 


attcagctcc 


ggttcccaac 


gatcaaggcg 


agttacatga 


tcccccatgt 


tgtgcaaaaa 


2940 


agcggttagc 


tccttcggtc 


ctccgatcgt 


tgtcagaagt 


aagttggccg 


cagtgttatc 


3000 


actcatggtt 


atggcagcac 


tgcataattc 


tcttactgtc 


atgccatccg 


taagatgctt 


3060 


ttctgtgact 


ggtgagtact 


caaccaagtc 


attctgagaa 


tagtgtatgc 


ggcgaccgag 


3120 


ttgctcttgc 


ccggcgtcaa 


tacgggataa 


taccgcgcca 


catagcagaa 


ctttaaaagt 


3180 


gctcatcatt 


ggaaaacgtt 


cttcggggcg 


aaaactctca 


aggatcttac 


cgctgttgag 


3240 


atccagttcg 


atgtaaccca 


ctcgtgcacc 


caactgatct 


tcagcatctt 


ttactttcac 


3300 


cagcgtttct 


gggtgagcaa 


aaacaggaag 


gcaaaatgcc 


gcaaaaaagg 


gaataagggc 


3360 
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gacacggaaa 


tgttgaatac 


tcatactctt 


cctttttcaa 


tattattgaa 


gcatttatca 


3420 


gggttattgt 


ctcatgagcg 


gatacatatt 


tgaatgtatt 


tagaaaaata 


aacaaatagg 


3480 


ggttccgcgc 


acatttcccc 


gaaaagtgcc 


acctgacgtc 


taagaaacca 


ttattatcat 


3540 


gacattaacc 


tataaaaata 


ggcgtatcac 


gaggcccttt 


cgtctcgcgc 


gtttcggtga 


3600 


tgacggtgaa 


aacctctgac 


acatgcagct 


cccggagacg 


gtcacagctt 


gtctgtaagc 


3660 


ggatgccggg 


agcagacaag 


CGcgtcaggg 


cgcgtcagcg 


ggtgttggcg Vgtgtcgggg ' 


3720 


ctggcttaac 


tatgcggcat 


cagagcagat 


tgtactgaga 


gtgcaccata 


tgcggtgtga 


3780 


aataccgcac 


agatgcgtaa 


ggagaaaata 


ccgcatcagg 


cgccattcgc 


cattcaggct 


3840 


gcgcaactgt 


tgggaagggc 


gatcggtgcg 


ggcctcttcg 


ctattacgcc 


agctggcgaa 


3900 


agggggatgt 


gctgcaaggc 


gattaagttg 


ggtaacgcca 


gggttttccc 


agtcacgacg 


3960 


ttgtaaaacg 


acggccagtg 


aattcggcgc 


gccgagctcc 


tcgagcaaat 


ttacacattg 


4020 


ccactaaacg 


tctaaaccct 


tgtaatttgt 


ttttgtttta 


ctatgtgtgt 


tatgtatttg 


4080 


atttgcgata 


aatttttata 


tttggtacta 


aatttataac 


accttttatg 


ctaacgtttg 


4140 


ccaacactta 


gcaatttgca 


agttgattaa 


ttgattctaa 


attatttttg 


tcttctaaat 


4200 


acatatacta 


atcaactgga 


aatgtaaata 


tttgctaata 


tttctactat 


aggagaatta 


4260 


aagtgagtga 


atatggtacc 


acaaggtttg 


gagatttaat 


tgttgcaatg 


ctgcatggat 


4320 


ggcatataca 


ccaaacattc 


aataattctt 


gaggataata 


atggtaccac 


acaagatttg 


4380 


^.ggtgcatga 


acgtcacgtg 


gacaaaaggt 


ttagtaattt 


ttcaagacaa 


caatgttacc 


4440 


acacacaagt 


tttgaggtgc 


atgcatggat 


gccctgtgga 


aagtttaaaa 


atattttgga- 


4500 


aatgatttgc 


atggaagcca 


tgtgtaaaac 


catgacatcc 


acttggagga 


tgcaataatg 


4560 


aagaaaacta 


caaatttaca 


tgcaactagt 


tatgcatgta 


gtctatataa 


tgaggatttt 


4620 


gcaatacttt 


cattcataca 


cactcactaa 


gttttacacg 


attataattt 


cttcatagcc 


4680 


agcccaccgc 


ggtgggcggc 


cgcctgcagt 


ctagaaggcc 


tcctgcttta 


atgagatatg 


4740 


cgagacgcct 


atgatcgcat 


gatatttgct 


ttcaattctg 


ttgtgcacgt 


tgtaaaaaac 


4800 


ctgagcatgt 


gtagctcaga 


tccttaccgc 


cggtttcggt 


tcattctaat 


gaatatatca 


4860 


cccgttacta 


tcgtattttt 


atgaataata 


ttctccgttc 


aatttactga 


ttgtccgtcg 


4920 


agcaaattta 


cacattgcca 


ctaaacgtct 


aaacccttgt ■ 


aatttgtttt 


tgttttacta 


4980 


tgtgtgttat 


gtatttgatt 


tgcgataaat 


ttttatattt 


ggtactaaat 


ttataacacc 


5040 


ttttatgcta 


acgtttgcca 


acacttagca 


atttgcaagt 


tgattaattg 


attctaaatt 


5100 
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atttttgtct tctaaataca tatactaatc aactggaaat gtaaatattt gctaatattt 5160 
ctactatagg agaattaaag tgagtgaata tggtaccaca aggtttggag atttaattgt 522 0 
tgcaatgctg catggatggc atatacacca aacattcaat aattcttgag gataataatg 5280 
gtaccacaca agatttgagg tgcatgaacg tcacgtggac aaaaggttta gtaatttttc 5340 
aagacaacaa tgttaccaca cacaagtttt gaggtgcatg catggatgcc ctgtggaaag 5400 
tttaaaaata 5410 



<210> 18 

<211> 648 

<212> DNA 

<213> Phaeodactylum tricomutum 

<220> 

<221> CDS 

<222> (1) . . (648) 

<220> 
<223> 

<400> 18 

tgg tgg aaa aac aag cac aae gga cac -cac 
Trp Trp Lys Asn Lys His Asn Gly His His 
15 10 

tgc tec tec gca gtc gcg caa gat ggg gac 
Cys Ser Ser Ala Val Ala Gin Asp Gly Asp 
20 25 

ccc ctt etc gee tgg tec gtc eag caa gee 
' Pro Leu Leu Ala Trp Ser Val Gin Gin Ala 

35 - 40 

caa gcc gac gga aag gat teg ggt ttg gtc 
Gin Ala Asp Gly Lys Asp Ser Gly Leu Val 
50 55 

caa tec tac ttt tac ttt ccc ate ttg ttg 
Gin Ser Tyr Phe Tyr Phe Pro lie Leu Leu 
65 '70 

ttg aac gag tec ttc aag tgc gcc ttt ggg 
Leu Asn Glu Ser Phe Lys Cys Ala Phe Gly 

85 90 

aac get get etc gaa etc aag gcc aag ggt 
Asn Ala Ala Leu Glu Leu Lys Ala Lys Gly 
100 105 



gee gtc ccc aae 
Ala Val Pro Asn 



ceg gac ate gat 
Pro Asp lie Asp 
30 

cag tet tac egg 
Gin Ser Tyr Arg 
45 

aag ttc atg ate 
Lys Phe Met lie 
60 

etc gcc cgc ctg 
Leu Ala Arg Leu 
75 

ctt gga get gcg 
Leu Gly Ala Ala 



ctt eag tac ccc 
Leu Gin Tyr Pro 
110 



etc cac 48 
Leu His 

^15 

ace atg 96 
Thr Met . 



gaa etc 144 ' 
Glu Leu 

cgt aac 192 
Arg Asn 



teg tgg 240 
Ser Trp 
80 

teg gag 288 
Ser Glu 
95 

ctt ttg 33 6 
Leu Leu 



gaa aag get ggc ate ctg ctg cac tac get tgg atg ctt aca gtt teg 
Glu Lys Ala Gly lie Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser 
115 120 125 



384 



38 

tec ggc ttt gga cgc ttc teg ttc gcg tac acc gca ttt tac ttt eta 432 
Ser Gly Phe Gly Arg Plie Ser Plie Ala Tyr Thr Ala Phe Tyr Plie Leu 
130 135 140 

acc gcg acc gcg tec tgt gga ttc ttg etc gee att gtc ttt ggc etc 480 
Thr Ala Thr Ala Ser Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu 
145 150 155 160 

ggc cae aac ggc atg gee acc tac aat gee gae gee cgt ccg gac ttc 528 
Gly His Asn Gly Met Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe 
165 . 170 175 

tgg aag etc caa gtc acc acg act cgc aac gtc aeg ggc gga cae ggt 576 
Trp Lys Leu Gin Val Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly 
180 185 190 

ttc cec caa gee ttt gtc gac tgg ttc tgt ggt ggc etc eag tac caa 624 
Phe Pro Gin Ala Phe Val Asp T3:p Phe Cys Gly Gly Leu Gin Tyr. Gin' 
195 200 205 . 

gtc gac cae cae tta ttc ecc age 648 
Val Asp His His Leu Phe Pro Ser 
210 215 



<210> 19 

<211> 216 

<212> PRT . ' - ■ 

<213> PhaeodactylTom tricomutum 

<400> 19 

Trp Trp Lys Asn Lys His Asn Gly His His Ala Val Pro Asn Leu His 
1 5 10 . . 15 

Cys Ser Ser Ala Val Ala Gin Asp Gly Asp Pro Asp lie Asp Thr Met 
20 25 30 

Pro Leu Leu Ala Trp Ser Val Gin Gin Ala Gin Ser Tyr Arg Glu Leu 

35 40 : ~ r 45 

Gin Ala Asp Gly Lys Asp Ser Gly Leu Val Lys Phe Met lie Arg Asn 
50 "55 " . 60 . 

Gin Ser Tyr Phe Tyr Phe Pro lie Leu Leu Leu Ala Arg Leu Ser Trp 
65 70 ' . 75 80 

Leu Asn Glu Ser Phe Lys Cys Ala Phe Gly Leu Gly Ala Ala Ser Glu 

85 90 95 

Asn Ala Ala Leu Glu Leu Lys Ala Lys Gly Leu Gin Tyr Pro Leu Leu 

100 105 110 

Glu Lys Ala Gly lie Leu Leu His Tyr Ala Trp Met Leu Thr Val Ser 
115 120 125 



Ser Gly Phe Gly Arg Phe Ser Phe Ala Tyr Thr Ala Phe Tyr Phe Leu 
130 135 140 



39 



Thr Ala Thr Ala Ser Cys Gly Phe Leu Leu Ala lie Val Phe Gly Leu 

145 150 155 . 160 

Gly His Asn Gly Met Ala Thr Tyr Asn Ala Asp Ala Arg Pro Asp Phe 
165 . 170 175 

Trp Lys Leu Gin Val Thr Thr Thr Arg Asn Val Thr Gly Gly His Gly 
180 185 190 

Phe Pro Gin Ala Phe Val Asp Trp Phe Cys Gly Gly Leu Gin Tyr Gin 
195 200 205 

Val Asp His His Leu Phe Pro Ser 
210 215 

<210> 20 
'<211> 12093 
<212> DNA 
<213> Unknown 

<220> 

<223> pflanzlicher Escpressionsvektor mit einer 
Promotor-Terminator-Expressionskassette 

<400> 20 



gatctggcgc 


cggccagcga 


gacgagcaag 


attggcGgcc 


gcccgaaacg 


atccgacagc 


60 


gcgcccagca 


caggtgcgca 


ggcaaattgc 


accaacgcat 


acagcgccag 


cagaatgcca 


120 


tagtgggcgg 


tgacgtcgtt 


cgagtgaacc 


agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgatgccgac 


agcgtcgagc 


gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt 


tcacgtctgg 


cctccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca 


ctgataagtt 


ggtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt 


gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatcca,tg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 
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ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg 


caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaalta 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttc 


go'ggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


agggcagccc 


acctatcaag 


gtgtactgcc 


ttccagacga 


acgaagagcg 


attgaggaaa 


19,20 

f ..[.I 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aacggccggg 


gggtgcgcgt 


gattgccaag 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


gacgctcacc 


gggctggttg 


ccctcgccgc 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


cgcgccagaa 


acgccgtcga 


agccgtgtgc 


gagacaccgc 


ggccgccggc 


gttgtggata- 


2460 


cctcgcggaa 


aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 
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tgacagatga 


ggggcgcgat 


ccttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


ccgcccgttt 


ttcggccacc 


gctaacctgt 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


acgggatggg 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaattgga 


cctttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


aggcagcgcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


cgtgttgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


catatcaatg 


attttctggt 


gcgtaccggg 


ttgagaagcg 


gtgtaagtga 


actgcagttg 


4260 


ccatgtttta 


cggcagtgag 


agcagagata 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


gggacagctg 


atagacacag 


aagccactgg 


4380 


agcacctcaa 


aaacaccatc 


atacactaaa 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 
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tggtttcaaa 


atcggctccg 


tcgatactat 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


aaaagctgtt 


ttctggtatt 


taaggtttta 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


cttgttataa 


ttagcttctt 


ggggtatctt 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


taaatggcta 


aaatgagaat 


atcaccggaa 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


gtaaaagata 


cggaaggaat 


gtctcctgct 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


aacctatatt 


taaaaatgac 


ggacagccgg 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


gaaaaggaca 


tgatgctatg 


gctggaagga 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


gaacggcatg 


atggctggag 


caatctgctc 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920 


gaagagtatg 


aagatgaaca 


aagccctgaa 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


aggctctttc 


actccatcga 


catatcggat 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


ttagccgaat 


tggattactt 


actgaataac 


gatctggccg- 


atgtggattg 


cgaaaactgg 


5100 


gaagaagaca 


ctccatttaa 


agatccgcgc 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gatggcaaag 


taagtggctt 


tattgatctt 


gggagaagcg 


gcagggcgga 


caagtggtat 


5280 


gacattgcct 


tctgcgtccg. 


gtcgatcagg 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 


ctattttttg 


acttactggg 


gatcaagcct 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat 


gpcggcgaca 


agcaggagcg 


5460 


caccgacttc 


ttccgcatca 


agtgttttgg 


ctctcaggcc 


gaggcccacg 


gcaagtattt . 


5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 


ggcaccaggc 


gggtcaaatc 


aggaataagg 


gcacattgcc 


ccggcgtgag 


tcggggcaat 


5700 


cccgcaagga 


gggtgaatga 


atcggacgtt 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


caagctacgg 


ccaagatcga 


5880 


gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 
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ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


6300 


cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


ctgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt" 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgct 


'6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc tcaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagc agg t 


6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct 


tgtggggtca 


gttccggctg 


9'9'9'9'ttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


7080 


cgcgagatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggacggcccc 


72 60 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt 


gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc 


acttaatatt 


7440. 


tcgctattct 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttcatct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 


gtgttgacac 


caaacgcagc 


gctagatcct 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 


gtttccatgg 


cgttcggaac 


cgtgctgacc 


cgcaagtggc 


aacctcccgt 


gcctctgctc 


7740 


acctttaccg 


cctggcaact 


ggcggccgga 


ggacttctgc 


tcgttccagt 


agctttagtg 


7800 


tttgatccgc 


caatcccgat 


gcctacagga 


accaatgttc 


tcggcctggc 


gtggctcggc 


7860 


ctgatcggag 


cgggtttaac 


ctacttcctt 


tggttccggg 


ggatctcgcg 


actcgaacct 


7920 
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acagttgttt 


ccttactggg 


ctttctcagc 


cccagatctg 


gggtcgatca 


gccggggatg 


7980 


catcaggccg 


acagtcggaa 


cttcgggtcc 


ccgacctgta 


ccattcggtg 


agcaatggat 


8040 


aggggagttg 


atatcgtcaa 


cgttcacttc 


taaagaaata 


gcgccactca 


gcttcctcag 


8100 


cggctttatc 


cagcgatttc 


ctattatgtc 


ggcatagttc 


tcaagatcga 


cagcctgtca 


8160 


cggttaagcg 


agaaatgaat 


aagaaggctg 


ataattcgga 


tctctgcgag 


ggagatgata 


8220 


tttgatcaca 


ggcagcaacg 


ctctgtcatc 


gttacaatca 


acatgctacc 


ctccgcgaga 


8280 


tcatccgtgt 


ttcaaacccg 


gcagcttagt 


tgccgttctt 


ccgaatagca 


tcggtaacat 


8340 


gagcaaagtc 


tgccgcctta 


caacggctct 


cccgctgacg 


ccgtcccgga 


ctgatgggct 


8400 


gcctgtatcg 


agtggtgatt 


ttgtgccgag 


ctgccggtcg 


erggagctgtt 


ggctggctgg 


8460 


tggcaggata 


tattgtggtg 


taaacaaatt 


gacgcttaga 


caacttaata 


acacattgcg 


8520 


gacgttttta 


atgtactggg 


gtggtttttc 


ttttcaccag 


tgagacgggc 


aacagctgat 


8580 


tgcccttcac 


cgcctggccc 


tgagagagtt 


gcagcaagcg 


gtccacgctg 


gtttgcccca 


8640 


gcaggcgaaa 


atcctgtttg 


atggtggttc 


cgaaatcggc 


aaaatccctt 


ataaatcaaa 


8700 


agaatagccc 


gagatagggt 


tgagtgttgt 


tccagtttgg 


aacaagagtc 


cactattaaa 


8760 


gaacgtggac 


tccaacgtca 


aagggcgaaa 


aaccgtctat 


cagggcgatg 


gcccactacg 


8820 


tgaaccatca 


cccaaatcaa 


gttttttggg 


gtcgaggtgc 


cgtaaagcac 


taaatcggaa ■ 


8880 


ccctaaaggg 


agcccccga't 


ttagagcttg 


acggggaaag 


ccggcgaacg 


tggcgagaaa 


8940 


ggaagggaag 


aaagcgaaag 


gagcgggcgc 


cattcaggct 


gcgcaactgt 


tgggaagggc 


9000 


gatcggtgcg 


ggcctcttcg 


ctattacgcc 


agctggcgaa 


agggggatgt 


gctgcaaggc 


9060 


gattaagttg 


ggtaacgcca 


gggttttccc 


agtcacgacg 


ttgtaaaacg 


acggccagtg 


9120 


aattaattcc • 


catcttgaaa 


gaaatatagt 


ttaaatattt 


attgataaaa 


taacaagtca 


9180 


ggtattatag 


tccaagcaaa 


aacataaatt 


tattgatgca 


agtttaaatt 


cagaaatatt 


9240 


tcaataactg 


attatatcag 


ctggtacatt 


gccgtagatg, 


aaagactgag 


tgcgatatta 


9300 


tgtgtaatac 


ataaattgat 


gatatagcta 


gcttagctca 


tcgggggatc 


cgtcgaagct 


9360 


agcttgggtc 


ccgctcagaa 


gaactcgtca 


agaaggcgat 


agaaggcgat 


gcgctgcgaa 


9420 


tcgggagcgg 


cgataccgta 


aagcacgagg 


aagcggtcag 


cccattcgcc 


gccaagctct 


9480 


tcagcaatat 


cacgggtagc 


caacgctatg 


tcctgatagc 


ggtccgccac 


acccagccgg 


9540 


ccacagtcga 


tgaatccaga 


aaagcggcca 


ttttccacca 


tgatattcgg 


caagcaggca 


9600 


tcgccatggg 


tcacgacgag 


atcctcgccg 


tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 
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agttcggctg 


gcgcgagccc 


ctgatgctct 


tcgtccagat 


catcctgatc 


gacaagaccg 


9720 


gcttccatcc 


gagtacgtgc 


tcgctcgatg 


cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcgtatg 


cagccgccgc 


attgcatcag 


ccatgatgga 


tactttctcg 


9840 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tgccccggca 


cttcgcGcaa 


tagcagccag 


9900 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


acagctgcgc 


aaggaacgcc 


cgtcgtggcc 


9960 


agccacgata 


gccgcgctgc 


ctcgtcctgc 


agttcattca 


gggcaccgga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


ccgattgtct 


gttgtgccca 


gtcatagccg 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


,gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagtgaatat 


gagactctaa 


ttggataccg 


aggggaattt 


atggaacgtc 


10260 


agtggagcat 


ttttgacaag 


aaatatttgc 


tagctgatag 


tgaccttagg 


cgacttttga 


10320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt 


aaactccaga 


aacGcgcggc 


10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


catccagttt 


actttgcagg 


gcttcccaac^ 


10560 


cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


gctgtccata 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800- 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 


attaaagtga 


gtgaatatgg 


taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcaat 


11400 
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aatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat 


ataatgagga 


11460 


ttttgcaata 


ctttcattca 


tacacactca 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


agccagccca 


ccgcggtggg 


cggccgcctg 


cagtctagaa 


ggcctcctgc 


tttaatgaga 


11580 


tatgcgagac 


gcctatgatc 


gcatgatatt 


tgctttcaat 


tctgttgtgc 


acgttgtaaa 


11640 


aaacctgagc 


atgtgtagct 


cagatcctta 


ccgccggttt 


cggttcattc 


taatgaatat 


11700 


atcacccgtt 


actatcgtat 


ttttatgaat 


aatattctcc 


gttcaattta 


ctgattgtcc 


11760 


gtcgacgaat 


tcgagctcgg 


cgcgcctcta 


gaggatcgat 


gaattcagat 


cggctgagtg 


11820 


gctccttcaa 


cgttgcggtt 


ctgtcagttc 


caaacgtaaa 


acggcttgtc . 


ccgcgtcatc 


11880 


ggcgggggtc 


ataacgtgac 


tcccttaatt 


ctccgctcat 


gatcagattg 


tcgtttcccg 


11940 


ccttcagttt 


aaactatcag 


tgtttgacag 


gatatattgg 


cgggtaaacc 


taagagaaaa 


12000 


gagcgtttat 


tagaataatc 


ggatatttaa 


aagggcgtga 


aaaggtttat 


ccttcgtcca 


12060 


tttgtatgtg 


catgccaacc 


acagggttcc 


cca 
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gatctggcgc cggccagcga 


gacgagcaag 


attggccgcc 


gcccgaaacg 


atccgacagc 


60 


gcgcccagca caggtgcgca 


ggcaaattgc 


accaacgcat 


acagcgccag 


cagaatgcca 


120 


tagtgggcgg tgacgtcgtt 


cgagtgaacG 


agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


ataatcaggc cgatgccgac 


agcgtcgagc 


gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt tcacgtctgg 


cctccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca ctgataagtt 


ggtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 
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ccggcacgcg 


ac cgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gc gaggcggg 


tfctttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


gcgac agcga 


tgc cggcgag 


c gc ggc ggc a 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


t tcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


1 1 ggcgaaaa 


960 


ggs-ggctcgt 


tgtcaggaac 


g t tgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg 


caacccactc 


ac tacagcag 


age ca tgt ag 


acaacatccc- 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggt at cag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggc cage aa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


Gcgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


c t taccgga t 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttg 


ggggt c at t a 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggc agga t a 


ggtgaagfcag 


gcccacccgc 


gao'ccraa t crt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggt gc tea 


acgggaa t c c 


tgctctgcga 


acre taacccra' 


1800 


ctaccgccgg 


cgtaacagafc 


gagggcaagc 


gga t ggc t ga 


tgaaaccaag 


ccaaccagga 


1860 


Q-gggcagccc 


acctatcaag 


gtgtactgcc 


ttccagacga 


acgaagagcg 


at t gaggaaa 


1920 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


c agggc Jb ac a 


1980 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


^cggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aacggccggg 


gggtgcgcgt 


gattgccaag 


cacgtcccca 


fcgcgctccat 


caagaagagc 


2280 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


gacgctcacc 


gggctggttg 


ccctcgccgc 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400" 
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cgcgccagaa 


acgccgtcga 


agccgtgtgc 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


cctcgcggaa 


aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


cgcctgattt 


tacgcgagtt 


tcc'cacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgacagatga 


ggggcgcgat 


ccttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


ccgcccgttt 


ttcggcca.cc 


gctaacctgt 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


acgggatggg . 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaattgga 


cctttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


'3540 


ggcaaggcat 


aggcagcgcg 


Gttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


'3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgi- caaaggg 


cgacagcagg 


cue ac aagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


•5 Q ^ n 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 
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cgtgttgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


catatcaatg 


attttctggt 


gcgtaccggg 


ttgagaagcg 


gtgtaagtga 


actgcagttg 


4260 


ccatgtttta 


cggcagtgag 


agcagagata 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


gggacagctg 


atagacacag 


aagccactgg 


4380 


agcacctcaa 


aaacaccatc 


atacactaaa 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 


tggtttcaaa 


atcggctccg 


tcgatactat 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


aaaagctgtt 


ttctggtatt 


taaggtttta 


■gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


cttgttataa 


ttagcttctt 




taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


.taaatggcta 


aaatgagaat 


atcaccggaa 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


gtaaaagata 


cggaaggaat 


gtctcctgct 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


aacctatatt 


taaaaatgac 


ggacagccgg 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


gaaaaggaca 


tgatgctatg 


gctggaagga aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


gaacggcatg 


atggctggag 


caatctgctc 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


4920 


gaagagtatg 


aagatgaaca 


aagccctgaa 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


aggctctttc 


actccatcga 


catatcggat 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


ttagccgaat 


tggattactt 


actgaataac 


gatctggccg 


atgtggattg 


cgaaaactgg 


5100 


gaagaagaca 


ctccatttaa 


agate cgcgc 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gacctgggag 


acagcaacat 


c 1 1 1 gt gaaa 


5220 


gatggcaaag 


taagtggctt 


tattgatctt 


gggdgaagcg 


gcagggcgCTa 


caagtggtat 


5280 


gacattgcct 


tctgcgtccg 


gtcgatcagg 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 


ctattttttg 


acttactggg 


gatcaagcct 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


caccgact.tc 


ttccgcatca 


agtgttttgg ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 


ggcaccaggc 


gggtcaaajbc 


aggaataagg 


gcacattgcc 


ccggcgtgag 


tcggggcaat 


5700 


cccgcaagga 


gggtgaatga 


atcggacgtt 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


caagctacgg 


ccaagatcga 


5880 
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gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagatcaagg 


aaatgcagct 


6120 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


6300 


cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


ctgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgct- 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc 


tcaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagcaggt 


6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct . 


tgtggggtca 


gttccggctg 


gg'ggttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


7080 


cgcgagatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggacggcccc 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt 


gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc 


acttaatatt 


7440 


tcgctattct 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttcatct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 
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gtgttgacac 


caaacgcagc 


gctagatcct 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 


gtttccatgg 


cgttcggaac 


cgtgctgacc 


cgcaagtggc 


aacctcccgt 


gcctctgctc 


7740 


acctttaccg 


cctggcaact 


gercggccgga 


ggacttctgc 


tcgttccagt 


agctttagtg 


7800 


tttgatccgc 


caatcccgat 


gcctacagga 


accaatgttc 


tcggcctggc 


gtggctcggc 


7860 


ctgatcggag 


cgggtttaac 


ctacttcctt 


tggttccggg 


ggatctcgcg 


actcgaacct 


7920 


acagttgttt 


ccttactggg 


ctttctcagc 


cccagatctg 


gggtcgatca 


gccggggatg 


7980 


catcaggccg 


acagtcggaa 


"cttcgggtcG 


ccgacctgta 


ccattcggtg 


agcaatggat 


8040 


aggggagttg 


atatcgtcaa 


cgttcacttc 


taaagaaata 


gcgccactca 


gcttcctcag 


8100 


cggctttatc 


cagcgatttc 


ctattatgtc 


ggcatagttc 


tcaagatcga 


cagcctgtca 


8160 


cggttaagcg 


agaaatgaat 


aagaaggctg 


ataattcgga 


tctctgcgag 


ggagatgata 


8220 


tttgatcaca 


ggcagcaacg 


ctctgtcatc 


gttacaatca 


acatgctacc 


ctccgcgaga 


8280 


tcatccgtgt 


ttcaaacccg 


gcagcttagt 


tgccgttctt 


ccgaatagca 


tcggtaacat 


8340 


gagcaaagtc 


tgccgcctta 


caacggctct 


cccgctgacg 


ccgtcccgga 


ctgatgggct 


8400 


gcctgtatcg 


agtggtgatt 


ttgtgccgag 


ctgccggtcg 


gggagctgtt 


ggctggctgg 


8460 


tggcaggata 


tattgtggtg 


taaacaaatt 


gacgcttaga 


caacttaata 


acacattgcg 


8520 


gacgttttta 


atgtactggg 


gtggtttttc 


ttttcaccag 


tgagacgggc 


aacagctgat 


8580 


tgcccttcac 


cgcctggccc 


tgagagagtt 


gcagcaagcg 


gtccacgctg 


gtttgcccca 


8640 


gcaggcgaaa 


atcctgtttg 


atggtggttc 


cgaaatcggc 


aaaatccctt 


ataaatcaaa 


8700 


agaatagccc 


gagatagggt 


tgagtgttgt 


tccagtttgg 


aacaagagtc 


cactattaaa 


8760 


gaacgtggac 


tccaacgtca 


aagggcgaaa 


aaccgtctat 


cagggcgatg 


gcccactacg 


8820 


tgaaccatca 


cccaaatcaa 


gttttttggg 


gtcgaggtgc 


cgtaaagcac 


taaatcggaa 


8880 


ccctaaaggg 


agccGccgat 


ttagagcttg 


a.cggggaaag 


ccggcgaacg 


tggcgagaaa 


8940 


ggaagggaag 


aaagcgaaag 


gagcgggcgc 


cattcaggct 


gcgcaactgt 


tgggaagggc 


9000 


gatcggtgcg 


ggcctcttcg 


ctattacgcc 


agctggcgaa 


agggggatgt 


gctgcaaggc 


9060 


gattaagttg 


ggtaacgcca 


gggttttccc 


agtcacgacg 


ttgtaaaacg 


acggccagtg 


9120 


aattaattcc 


catcttcraaa 


gaaatatagt 


ttaaatafctt 


attgataaaa 


taacaagtca 


9180 


ggtattatag 


tccaagcaaa 


aacataaatt 


tattgatgca 


agtttaaatt 


.cagaaatatt 


9240 


tcaataactg 


attatatcag 


ctggtacatt 


gccgtagatg 


aaagactgag 


tgcgat^tta 


9300 


tgtgtaatac 


ataaattgat 


gatatagcta , 


, gcttagctca 


tcgggggatc 


cgtcgaagct 


9360 
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agcttgggtc 


ccgctcagaa 


gaactcgtca 


agaaggcgat 


agaaggcgat 


gcgctgcgaa 


9420 


tcgggagcgg 


cgataccgta 


aagcacgagg 


aagcggtcag 


cccattcgcc 


gccaagctct 


9480 


tcagcaatat 


cacgggtagc 


caacgctatg 


tcctgatagc 


ggtccgccac 


acccagccgg 


9540 


ccacagtcga 


tgaatccaga 


aaagcggcca 


ttttccacca 


tgatattcgg 


caagcaggca 


9600 


tcgccatggg 


tcacgacgag 


atcctcgccg 


tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 


agttcggctg 


gcgcgagccc 


ctgatgctct 


tcgtccagat 


catcctgatc 


gacaagaccg 


9720 


gcttccatcc 


gagtacgtgc 


tcgctcgatg 


cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcgtatg 


^cagccgccgc 


attgcatcag 


ccatgatgga 


tactttctcg 


9840 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


acagctgcgc 


aaggaacgcc 


cgtcgtggcc 


9960 


agccacgata 


gccgcgctgc 


ctcgtcctgc 


agttcattca 


gggcaccgga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


ccgattgtct 


gttgtgcGca 


gtcatagccg 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagtgaatat 


gagactctaa 


ttggataccg 


aggggaattt 


atggaacgtc 


10260 


agtggagcat 


ttttgacaag 


aaatatttgc 


tagctgatag 


tgaccttagg 


cgacttttga 


10320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt 


aaactccaga 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


catccagttt 


actttgcagg 


gcttcccaa'G 


10560 


cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


gctgtccata 


aaaccgccca 


106,20 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


-actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aac g t c t aaa 


cccttgtaat 


ttgtttttgt 


t utactatgt 


gtgttatgta 




tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 
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attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagcgga tccgatatcg ggcccgctag cgttaaccct gctttaatga gatatgcgag 11580 
acgcctatga tcgcatgata tttgctttca attctgttgt gcacjgttgta aaaaacctga 11640 
gcatgtgtag ctcagatcct taccgccggt ttcggttcat tctaatgaat atatcacccg 11700 
ttactatcgt atttttatga ataatattct ccgttcaatt tactgattgt ccgtcgacga 11760 
attcgagctc ggcgcgcctc tagaggatcg atgaattcag atcggctgag tggctccttc 11820 
aacgttgcgg ttctgtcagt tccaaacgta aaacggcttg tcccgcgtca tcggcggggg 11880 
tcataacgtg actcccttaa ttctccgctc atgatcagat tgtcgtttcc cgccttcagt 11940 
ttaaactatc agtgtttgac aggatatatt ggcgggtaaa cctaagagaa aagagcgttt 12000 
attagaataa tcggatattt aaaagggcgt gaaaaggttt atccttcgtc catttgtatg 12060 
tgcatgccaa ccacagggtt cccca 12085 

<:210> 22 
<211> 12079 
<212> DNA 
<213> Unknown 

<220> 

<223> pflanzlicher Express ionsvektor mit einer 
Promo tor-Terminator-Expressionskassette 

<400> 22 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 
gcgcccagca caggtgcgca ggcaaattgc accaacgcat .acagcgccag cagaatgcca 120 
tagtgggcgg tgacgtcgtt cgagtgaacc agatcgcgca ggaggcccgg cagcaccggc 180 
ataatcaggc cgatgccgac agcgtcgagc gcgacagtgc tcagaattac gatcaggggt 240 
atgttgggtt tcacgtctgg cctccggacc agcctccgct ggtccgattg aacgcgcgga 300 
ttGttta.tca ctgataagtt ggtggacata ttatgtttat cagtgataaa gtgtcaagca 3 60 
tgacaaagtt gcagccgaat acagtgatcc gtgccgccct ggacctgttg aacgaggtcg 420 
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gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcaigcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 


ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg 


caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggtt-atcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttc 


ggggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


agggcagccc 


acctatcaag 


gtgtactgcc 


ttccagacga 


acgaagagcg 


attgaggaaa 


1920 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


aaatcacggg 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 
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gc aagg t c a. t 


cratacrgcq'tg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aac crcrc c crcro' 


crcrcrt crc crccT t 


gattgccaag 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


crac 1 1 ccrccTcr 


acre tcrcrt craa 


gtacatcacc 


craccracrc aacr 


gcaagaccga 


gcgccfcfctgc 


2340 


gacgctcacc 


acrcrc tcrcrt tcr 

33 53 33^ ^33 23 ^ 


ccctcgccgc 


tcrcrac fccraccr 

»— 5g55v^w W5^5g>i^v^ 


gccgtctafcg 


gccctgcaaa 


2400 


cgcgccagaa 


acgccgtcga 


agccgtgtgc 


gagacaccgc 


ggccgccggc 


gttgtggafca 


2460 


c c t c cic crcraa 


aac 1 1 ggc c e 


tcactgacag 


a t O'aaaacfc a 


gacgttgaca 


cttgaggggc 


2520 


ccfactcaccc 


crcrc crccrcrc crt 


t gac aga fc ga 


crcrcTcrcacjcrc t 

33 33 9 9 ^***'53 33 *^ 


cgafcfctcggc 


cggcgacgfcg 


2580 


cracrc tcrcrc ca 


gc c t cgcaaa 


tcggcgaaaa 


cgcctgattfc 


tacgcgagtt 


tcccacagat 


2640 


gatQ'tggaca 


acr c c t crcrcrcr a 


taagfcgccct 


accrcrfcattcra 


cacttgaggg 


gcgcgacfcac 


2700 


t crac acra t O'a 


crcrcrcrccrccrat 


ccfctgacact 


fcgaggggcag 


agfcgc t gaca 


gatgaggggc 


2760 


crcacctafctcr 


ac at t tcracrcr 


crcrc t crt Gcac 


aggc agaaaa 


tccagcafcfcfc 


gcaagggfctfc 


2820 


ccg'cccg'ttt 


fcfccggccacc 


gcfcaacctgt 


cttfctaacct 


gcttttaaac 


caatatttat 


2880 


aaaccttcrtit 


tttaaccacrcr 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 

33 ^^^^33 33 33 9 33 33 


2940 


fccrcGr'cncct 


tctccraacGC 


t c c ccrcrc c G cr 


cfcaacgcggg 


ccfccccatcc 


ccccaggggc 


3000 




crcrcGcrccraac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


1 1 crc ccrcrcra t 


c ggggc ag t a 


accrcrcratcrcrcr 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


crcacrcrtcrctcr 


gcatcgacat 


tcagcgacca 


ggtgccgggc 

33 53 **59'^^59 53 53^ 


agtgagggcg 


3180 


crc crcrc c t cro'cr 


t crcrc crcrc c t cr 


cccttcactt 


cacrcccrtccrcr 


ggcafctcacg 


gacttcatgg 


3240 


c cr CTQcrc c crcrc 


aatfctttacc 


fc tcrcrcrcafc t c 


tfcggcatagfc 


gat cgcggg t 

3323 **^23^Z333 33 


gccgtgctcg 


3300 


t cr 1 1 c crcfCTcrcr 


tcrccrataaac 


c c acre craac c 


afcfctgaggtg 


ataggtaaga 


tfcataccgag 


3360 


crt~ a tcraaa^ r* 


era craa fc t* ctcts. 


cc tfctacacra 


afcfcac tctat 


gaagc gc cat 


a 1 1 1 aaaaag 


3420 


cfcacr'aacrac 


craacracrcra t cr 


aacracrcratcra 


ggO^ggcagafc 


tgccttgaat 


atattgacaa 


3480 


fcactcrafcaacT 


ataatafcatc 


ttttafcatag 


aagatatcgc 


cgtatgtaag 


aatttcacracr 


3540 


crcrc aacT crc at 


acr cr c acr c cr c cr 

53 ^^^*^33 i3 i3 


cfcfcatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcafcggact 


aa tgc t tgaa 


ac c c aggac a 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


fcattgafcagt 


gttttatgtfc 


cagafcaafcgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


fcttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 
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L. y a. ciy o ciy y 






pcrr* cat* acrtcr 


c cr 1 1 c ac c era 


3960 


ai-acyX-ycyc 


a a a a ^ /~f 1^ 

aac aac c g u c 


4~ 4" r^rxrvA r~ra 

i« uccy y ciy O.C 


+- /t4* 3 4* r"" ctr* 
L^y u«v^o. i^d^^y Vi.* 


y 1^0.0.0. ci.wg.y v_» 




4020 


y C y a t u t. ay C 


y^ a 4" a 

cccgacauag 


^ 1^ /"« a /"< 4~ /*r4~ 4** 

ccccac uy L. u 


cy uccdL«ci«>c 


cy ey wdy civ^y 


a 4- rr a /-«rr4- /-I a /-I 


4080 


i-y CCCy y C uy 


uax-gcgcgag 


g uac (jy a.c 


y cy y c c L^y dy 


V« t.^ L« U> l^CLCL^ 1^ 




4140 


c gi: gu c gay g 


ccaacy ccco. 


L-aaugcgygc 


uy u. L-y cccy y 




cpiir ]~ c^Pi \~CTCTC 


4200 


catatcaatg 


at- c ci- c u gg Ti. 


gcguaccggg 


4— 4"/^a/^a sxf^f^eT 

ccgagaagcg 


y uy uddy L.yd 


dc uy Cdy u uy 


4.9 fin 


M 4^ 4* 4«" ^* 

ccaugcuu ua 


cggcagugag 


a f*re^ a /^"Sl /^a 4** a 

age agag a c a 


rtt^ rTf* 4" r^a 4~ rri* 

ycyc uydcy L> 


ccyycyy uyc 


L> e i« L.y eoy L> L> 


4320 


acgcaccacc 


c c gi^ c ay i^ay 


4- /-i*a a a orrra 

c u y ddCdy y ct 


yy y dwdy w ^y 


CI. L«c«.y u\^cLwM.y 


a;? rrc c a r* t* era* 

Cl.CL^ Nw^CLw y 


4380 


ay c a c c u <j aa 


a a a o a ^a +" 


a4"a/^a<^4~s^;s»53 
CI. L.CLCC«.C L.CLCXCL 


L.k_#dy L*dC4.y v« L> 


y ^ >w« Ci. w CL 


V.^ >.<■ &{> l.»C<LO. k^^^ 


4440. 


x-yycuucaaa 






y L* L>Cl L»CL^y XaoV' 




ar*aa.ctfctcra 


4500 


aaaayc uy 


u u<j ugy uau u 


4" a a jTi*r4~ 4* 4" 1~ a 

uday y c u l. l*ci 


i-f a a 4- a a rrrr 
^CLca c«y ccia.y y 




1" crcracrt* t* cert* 


4550 


cj u uy cuauaa 




yy y y ccil.c w u 


4-aaa4-ay-«t- fri" 






4620 


i-aaa uggc ua 


a a 4~ i^a a 4~ 

aaa ugagaa u 


a 4~ a 1^ f^t^ a a 

aucaccggaa 


4" 4~ rra a a a a a 
U cy ddddddC 


4~ <^a 4~ <^<^a a a 
u>y d i.*Vi«y dCLdd 


ci u.ciewy w iM*y ^ 


4680 


g u aaaaga u a 


^*<^r^a a *^/^a a 4" 

cggaaggaau 


y uvj U.VJC uy c u 


a a rtrx^ ja 4~ a i~ a 

ddyy udL.dCd 


dgc cyy cy yy 


CLy dctcqi ^y cici. 


4740 


aacccacauu 


-J— a a a a a 4" ^^a 

uaaaaacgac 


ggacagc egg 


4~ a 4~ a a a rrrrrrsa 
L.d L.dddy y y d 


v^cdVafW i^cii^y ci 


4- pf|- rrrr Si a /-« rrrr 
L.y o^^dOiWyy 


4800 

*X U W w 


gaaaaggaca 


4~ 4^ f^/^ 4~ a 4^ 

L.y augc ua ug 


yc L.y ydciy y d 


ddy y o y 


1" 1~ rr* ?^ rrrr"!" 
o^wcLCLCiy y 1^ 


cct"rrc;=? d" i" t" 


4860 


gaacggcaug 


a 4~ f^f^r^ 4~ a 

acggc uggag 


caa uc u*y c 


a 4" rra rrt* cxcx 

duydy L^y dy y 


ccy dcyycy u 


v^wu.wi«yv^L>v«>y 


4920 


gaagagtacg 


a ^ ^va 4~ .^^a a a 

aagacgaaca 


a a *^4~ ^pa a 

aagccc ugaa 


a a /~f a 4" 4~ a 4" /^or 

aagacca v-cy 


dye uy t.dL*yc 


y y dy uy cd uc 


■± -7 O W 


aggc ucu u uc 


acuccaucga 


a 4" a 4~ ^"t/^^pa 4~ 

cauaucggai^ 


4* /^4" 4" a 4^ a 

cgcccccdud 


'f^ #Ta a a f^f^ 4* 4~ 
c y dd cdy c l. u 


dy dwdy eey e 


S040 

»J Vy "a: W 


u uagccgaat. 


4** «^/^a 4™ a <^ 4~ 

cggaui-acT- u 


a 4" /^a a 4~ a a 

dc L.gaa uaac 


<^a 4" 4** rTi~Xf^ ^ 

yduc i^y y ccy 


dcy L.yycLu.i^y 


rra a ;=i a t" prrr 
ey CLCLCLCLe I— y y 




gaagaayaca 


4~ * 4~ 4^ 4" a a 

c uccai^ uuaa 


a /^a 4~ /~i r^t~TC*fXt^ 

aga L.C cgcgc 


ydy c uy cd L.y 


d L» e L« L« L« L> ddd 


/-ra r*rfrxs^ p\ p\ p\ 
y dey y Ci.ciq.a.y 


5160 

■M* W V/ 


c c cy aay agg 


aac u uy u u 


c wcccdcyy c 


y dec uy y y dy 


CLVm>A^\.<>CImv^CL L> 


/-^ 4- 4- frrt* rrajs? a 


5220 


gatggcaaag 


caaguggc u t. 


4~ a 4" "Pinra t* t* 

cauuyduc u u 


yyy dy ddy cy 


y Cdy y y eyy d 


*w ^CLy L>y y l^cl i— 


•5280 


gacau. ugcc t- 


-f— /—I -f— rxf^r^^ /~» rr 

cci-y cy t-c^oy 


gucyauL-dyy 


y dy ydudccy 


y y y MOiy clc^(w>ci. 


y L^CL L«y i^v.^y CLy 


5340 


c T- a u T- 1. u I- X- g 


a I" 4" a 4" F^rxf^ 

ac I- u ac uggg 


r^a 4" a a rxr~* /~« 4— 

gai^cddy cc l- 


/^a 4* 4" f^cxc^^ /"Ta 

yd L. uy y y dy d 


ddCL cddCLq. 


l^CL y— CL l_ L« U« \— CL 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


caccgacttc 


ttccgcatca 


agtgttttgg 


ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 



57 



ggcac c aggc 


gggtcaaatc 


aggaataagg 


gcacac ugcc 


ccggcgngag 


ucggggcaau 




c c cgcaagga 


gggtgaafcga 


atcggacgtt 


cgaccggaag , 


gcaxzacaggc 


aagaac uga u 


3 / DU 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg 


ccaugcgx-gc 


Do^ U 


gccccQ"cgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


c aagc t ac gg 


ccaagaucga 


Do oU 


gcgcgacagc 


gtgcaactgg 


ctccccptgc 


ccugcccgcg 


ccaucggccg 


ccgcggagcg 


D J? f± U 


ttcgcgtcgt 


ctcgaacagg 


9-ggcggcagg 


c ucggcgaag 


u cga ugac ca 


ucgacacgcg 


n no 
o u U u 


aggaac t a t g 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gaccuggcaa 


. aacaggucag 


o u o w 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cac gaagc ag 


G aga t c aagg 


aaaugcagcu 


D JL^U 


ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 




ccgctctgcc 


cfcgttcacca 


cgcgcaacaa 


gaaaatcccg 


c gc gaggc gc 


c gc aaaac aa 




ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


age tgcgggc 


1 nn 


cgacgatgac 


gaac t ggtgt 


ggc age agg t 


gttggagtac 


gcgaagcgca 


cccccaccgg 




cgagccgatc 


accttcacgt 


tc tacgagc t 


ttgccaggac 


c t gggc t ggt 


cgaccaaugg 


/J o n 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


c ga cgggc c u 


04t oU 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgt cgc tg 


c tgcaccgc t 


uccgcgcccu 


>i n 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


4~ /'*^4<* /^y*^4** /*^/^4^ 

ccgncgngcu 


0 o u u 


gttfcgctggc 


gaccactiaca 


cgaaattcat 


atgggagaag 


uaccgcaagc 


tgucgccgac 


O O OU 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcac cgggag 


ccguacccgc 


u caagc ugga 


o / ^ u 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgug 


aagaag^gg c 


gc gage agg t 


^'7 OA 
O / oU 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcc t 


gggtcaatga 


Q yi n 


tgacctggtg 


cattgcaaac 


gctagggcct 


tgtggggtca 


gttccggctg 


ggggttcagc 


^ Q A A 

by uu 


agccagcgct 


ttactggcat 


1 1 c aggaac a 


agcgggc ac t 


gc t cgacgca 


cttgcttcgc 


oy ou 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


t acgaac t gc 


cgataaacag • 


aggat t aaaa 


•7 A o n 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggc 1 1 ggag 


cggccgacgt 


gc agga u L. E. c 


^7 n Q n 
/ U o u 


cgcgagat cc 


ga fc t g t cggc 


c c t gaagaaa 


gc tec agaga 


tgttcgggtc 


cgu ucacgag 


/ X4fc u 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggaeggcccc 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt 


gatgatcgtc 


7380 



cgacagattc caacgggaat ctggtggatg 
tcgctattct ggagcttgtt gtttatttcg 
acggtaggcg ctgtgcagcc gctgatggtc 
ccgatacgat tgatggcggt cctgggggct 
gtgttgacac caaacgcagc gctagatcct 
gtttccatgg cgttcggaac cgtgctgacc 
acctttaccg cctggcaacfe ggcggccgga 
tttgatccgc caatcccgat gcctacagga 
ctgatcggag cgggtttaac ctacttcctt 
acagttgttt . ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaagcg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaaaggg agcccccgat ttagagcttg 
ggaagggaag aaagcgaaag gagcgggcgc 
gatcggtgcg ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 



58 

cgcatcttca tcctcggcgc acttaatatt 7440 
gtctaccgcc tgccgggcgg ggtcgcggcg 7500 
gtgttcatct ctgccgctct gctaggtagc 7560 
atttgcggaa ctgcgggcgt ggcgctgttg 7620 
gtcggcgtcg cagcgggcct ggcgggggcg 7680 
cgcaagtggc aacctcccgt gcctctgctc 7740 
ggacttctgc tcgttccagt agctttagtg 7800 
accaatgttc tcggcctggc gtggctcggc 7860 
tggttccggg ggatctcgcg actcgaacct 7920 
cccagatctg gggtcgatca gccggggatg 7980 
ccgacctgta ccattcggtg agcaatggat 8040 
taaagaaata gcgccactca gcttcctcag 8100 
ggcatagttc ' tcaagatcga cagcctgtca 8160 
ataattcgga tctctgcgag ggagatgata 8220 
gttacaatca acatgctacc ctccgcgaga 8280 
tgccgttctt ccgaatagca tcggtaacat 8340 
cccgctgacg ccgtcccgga ctgatgggct 8400 
ctgccggtcg gggagctgtt ggctggctgg 8460 
gacgcttaga caacttaata acacattgcg 8520 
ttttcaccag tgagacgggc aacagctgat 8580 
gcagcaagcg gtccacgctg gtttgcccca 8640 
cgaaatcggc aaaatccctt ataaatcaaa 8700 
tccagtttgg aacaagagtc cactattaaa 8760 
aaccgtctat cagggcgatg gcccactacg 8820 
gtcgaggtgc cgtaaagcac taaatcggaa 8880 
acggggaaag ccggcgaacg tggcgagaaa 8940 
cattcaggct gcgcaactgt tgggaagggc 9000 
agctggcgaa agggggatgt gctgcaaggc 9060 
agtcacgacg ttgtaaaacg acggccagtg 9120 
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craaatatacrt 


ttaaatattt 


attgataaaa 


taacaagtca 


9180 


(Tfrt* a t* t" a t" ;5 rr 




aacataaatt 


tattgatgca 


agt 1 1 aaa 1 1 


cagaaatatt 


9240 






CI t cTcrt ac a 1 1 


crc ccrfcacra t cr 


aaagac t gag 


tgcgatatta 


9300 


t" rrt" rrt" ;r a t" a ^ 


a t"aaa t" t'cra t" 


crafcafcacrcta 


gcttagctca 


tccrcrcrcrcratc 


cgtcgaagct 


9360 


r5 rf t* t" nrrrrr "h 


<Vi# ^ \^ v.* CLV^ L«L Vi.4. 


craacfcccrfcca 


agaaggcgat 


agaaggcgat 


gcgctgcgaa 


9420 






aacTc accf acrcT 


aacrccrcrtcacr 


cccattcgcc 


gccaagctct 


9480 




r* a r'crcrcrt acre 

'*-«dv*yyy *-»<ii.y Vi* 


caaccrcfcafccr 


fccctgatagc 


ggtccgccac 


acccagccgg 


9540 


a r* a rrtr* rra 
tto' CLNa* Q,y L«wycL 


t" rra a t r* c acra 


aaacTG crcrc c a 


ttttccacca 


tgatattcgg 


caagcaggca 


9600 


^ ccic cfilr crrrrr 
«— v-»y w^ci. v-y y y 


fc a c era c cracr 


atcctccrcccT 


tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 


CLy u> 1^ \^y y ^ ^ 


rrr« or* rra rrr* r* r* 
y vy oy ciy 


c t* crafc CTC fc G t 


tcgtccagat 


catcctgatc 


gacaagaccg 


9720 




y ciy i««cLoy u*y 


t* r* rrr* t* r*cra 1" cr 

L.^y ikii.v^y a. L«y 


Gcra fccrfc t tccr 


c t tcrcrtcrcrt c 


gaa tgggc ag 


9780 


y u«a.y v^oy y 


a a crr*rrf" ai" cr 


c acre c crc cere 


atfcgcatcag 


ccatgatgga 


tactttctcg 


9840 


y w CLy y CLy Vi.^ clcl 


y ^3 *^y ^t. 


cacrcracratcc 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 




^ L> L« CLy L»y CLv* 


a a ccrl" ccracrG 


acacrc t crc crc 


aaggaacgcc 


.cgtcgtggcc 


9960 




yccy vjy uy 


w Uv^y L.y 


a rri" t" c 3 1" t* ca 


crcrcr c ac c crcra 

.y y y y 


c acrer t c crcr t c 


10020 


l« l«.y CLv.<CLCLCLCLCL 


y dd.^ ^-.y y y oy 


c c c c t* crc* CTC i" 


era cacrGccrcra 

y d^-*t*y w'w'y y t* 


ac accrcrc crcrc 


ate acracrc aer 

\^ \^ *-*3g ***35 3^ 


10080 


v_«v^ydi^Lpy u>\^ 


y t_>y i^y *k^<^ v^c*. 


crtcatacrcGCT 


aatagcctct 


ccacc caagc 


ggc cggagaa 


10140 


O 1" fTl^ fT'h" ^ 

i^y ^y i^y v^o. 


clw wvm>cl L«*k,rf l. i.«y 


t" i" caa 1" ccaa 


crctcc caterer 


crccctccract 


agagtcgaga 


10200 


1^ L«.y y a L« u-y a 


era rrt^ rra a i* a t* 
y ny ^y cla u> 


era crar* t* c t aa 

y a«y ^Va* ^mca 


ttcrcratacccr 


acrcrcrcraa 1 1 1 


atggaacgtc 


10260 


CLy y ci.y v_c4. 


t* "h 1" "h rrp^ ?i a rr 
L> u« L» i—y CLv_«ci.cLy 


?i a a t* a i* t* t* CTG 


fcacTC fc era fcacr 


tgaccttagg 


cgacttttga 


10320 


cto y ^ y v.^ cLct u A 


o. ^y y ^ I- t-y 


CLv^y i-a.u>y ^.y 


t" 1" acre t cat t 


aaactccacra 


aacccgcggc 


10380 


L.y ciy uy y ^» 


#-1 +■ 4- sa =» r^rrl" t* 


rrc rrrrt* t* c crt" 
yv-»yy i^i-.v.-w-y 


Gacrfct" ccaaa 


certaaaaccrer 


cttgtcccgc 


10440 


y i^L«cLUv^yy v^y 


yyyy o\_>cll.clcl 


o rr "h era c t* c* c c 


t* t" aa t* 1" c t c c 


crctcatcratc 


ttgatcccct 


10500 


y y v.' v«> CI. u^Vta.'Ci.y 


u u>^w>v>« ^ ^y y ^-'y 


err* aacraaacrc 


catccagttt 


actttgcagg 


gcttcccaac 


10560 


l» i,^ CI. Vi* \^ ^^y cty 


rrrr r* cr rr* c r* a or 

y y v^y v*'wv*«v^«.y 


cfccrcrcaattc 


cercrttccrctt 


gctgtccata 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 
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attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


lilOO 


attaaagtga 


gtgaatatgg 


taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcaat 


11400 


aatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat 


ataatgagga 


11460 


ttttgcaata 


ctttcattca 


tacacactca 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


agccagcaga 


tctgccggca 


tcgatcccgg 


gccatggcct 


gctttaatga 


gatatgcgag 


11580 


acgcctatga 


tcgcatgata 


tttgctttca 


attctgttgt 


gcacgttgta 


aaaaacctga 


11640 


gcatgtgtag 


ctcagatcct 


taccgccggt 


ttcggttcat 


tctaatgaat 


atatcacccg 


11700 


ttactatcgt 


atttttatga 


ataatattct 


ccgttcaatt * 


tactgattgt 


ccgtcgacga 


11760- 


gctcggcgcg 


cctctagagg 


atcgatgaat 


tcagatcggc 


tgagtggctc 


cttcaacgtt 


11820 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


gtcatcggcg 


ggggtcataa • 


11880 


cgtgactccc 


ttaattctcc 


gctcatgatc 


agattgtcgt 


ttcccgcctt 


cagtttaaac 


11940 


tatcagtgtt 


tgacaggata 


tattggcggg 


taaacctaag 


agaaaagagc 


gtttattaga 


12000 


ataatcggat 


atttaaaagg 


gcgtgaaaag 


gtttatcctt 


cgtccatttg 


tatgtgcatg 


12060 


ccaaccacag 


ggttcccca 










12079 



<210> 23 
<211> 13002 
<212> DNA 
<213> Unknown 

<220> 

<223> pflanzlicher Expressionsvektor mit zwei 
Promotor-Terminator-Expiressionskassetten 

<400> 23 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 



gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca 120 



63. 



tagtgggcgg 


tgacgtcgtt 


cgagtgaacc 


agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgatgccgac 


agcgtcgagc 


gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt 


tcacgtctgg 


cctccgga.cc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca 


ctgataagtt 


ggtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt 


gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggegctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 


gcgaggcggg 


tttttcggcc 


ggggacgccg. 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


ttggcgaaaa 


960 


ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg 


caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


•ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttCGCcc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttc 


ggggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 



agggcagccc acctatcaag gtgtactgcc 
aggcggcggc ggccggcatg agcctgtcgg 
aaatcacggg cgtcgtggac tatgagcacg 
tgggccgcct gggcggcctg ctgaaactct 
tcggtgatgc cacgatcctc gccctgctgg 
gcaaggtcat gatgggcgtg gtccgcccga 
aacggccggg gggtgcgcgt gattgccaag 
gacttcgcgg agctggtgaa gtacatcacc 
gacgctcacc gggctggttg ccctcgccgc 
cgcgccagaa . acgccgtcga agccgtgtgo 
cctcgcggaa aacttggccc tcactgacag 
cgactcaccc ggcgcggcgt tgacagatga 
gagctggcca gcctcgcaaa tcggcgaaaa 
gatgtggaca agcctgggga taagtgccct 
tgacagatga ggggcgcgat ccttgacact 
gcacctattg acatttgagg ggctgtccac 
ccgcccgttt ttcggccacc .gctaacctgt 
aaaccttgtt tttaaccagg gctgcgccct 
tgccccccct tctcgaaccc tcccggcccg 
tgcgcccctc ggccgcgaac ggcctcaccc 
ttgccgggat cggggcagta acgggatggg 
ttgacgtgcc gcaggtgctg gcatcgacat 
gcggcctggg tggcggcctg cccttcactt 
cggggccggc aatttttacc ttgggcattc 
tgttcggggg tgcgataaac . ccagcgaacc 
gtatgaaaac gagaattgga cctttacaga 
ctaccaagac gaagaggatg aagaggatga 
tactgataag ataatatatc ttttatatag 
ggcaaggcat aggcagcgcg cttatcaata 
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ttccagacga 


acgaagagcg 


attgaggaaa 


1920 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


tatctataga 


atgggcaaag 


cataaaaact 


3600 



tgcatggact aatgcttgaa acccaggaca 
attgggtaat gactccaact tattgatagt 
tgtcatgcag ctccaccgat tttgagaacg 
gctgcctcag attcaggtta tgccgctcaa 
gcagctttcc cttcaggcgg gattcataca 
cgtcaaaggg tgacagcagg ctcataagac 
atacgtgcgc aacaaccgtc ttccggagac 
gcgatttagc cccgacatag ccccactgtt 
tgcccggctg tatgcgcgag gttaccgact 
cgtgttgagg ccaacgccca taatgcgggc 
catatcaatg attttctggt gcgtaccggg 
ccatgtttta cggcagtgag agcagagata 
acgcaccacc ccgtcagtag ctgaacagga 
agcacctcaa aaacaccatc atacactaaa 
tggtttcaaa atcggctccg tcgatacta't 
aaaagctgtt ttctggtatt taaggtttta 
cttgttataa ttagcttctt ggggtatctt 
taaatggcta aaatgagaat atcaccggaa 
gtaaaagata cggaaggaat gtctcctgct 
aacctatatt taaaaatgac ggacagccgg 
gaaaaggaca tgatgctatg gctggaagga 
gaacggcatg atggctggag caatctgctc 
gaagagtatg aagatgaaca aagccctgaa 
aggctctttc actccatcga catatcggat 
ttagccgaat tggattactt actgaataac 
gaagaagaca ctccatttaa agatccgcgc 
cccgaagagg aacttgtctt ttcccacggc 
gatggcaaag taagtggctt tattgatctt 
gacattgcct tctgcgtccg gtcgatcagg 
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ataaccttat agcttgtaaa ttctatcata 3660 
gttttatgtt cagataatgc ccgatgactt 3720 
acagcgactt ccgtcccagc cgtgccaggt 3780 
ttcgctgcgt atatcgcttg ctgattacgt 3840 
gcggccagcc atccgtcatc catatcacca 3 900 
gccccagcgt cgccatagtg cgttcaccga 3960 
tgtcatacgc gtaaaacagc cagcgctggc 4020 
cgtccatttc cgcgcagacg atgacgtcac 4080 
gcggcctgag ttttttaagt gacgtaaaat 4140 
tgttgcccgg catccaacgc cattcatggc 4200 
ttgagaagcg .gtgtaagtga actgcagttg 42 60 
gcgctgatgt ccggcggtgc ttttgccgtt 432 0 
gggacagctg atagacacag aagccactgg 4380 
tcagtaagtt ggcagcatca cccataattg 4440 
gttatacgcc aactttgaaa acaactttga 4500 
gaatgcaagg aacagtgaat tggagttcgt 4560 
taaatactgt agaaaagagg aaggaaataa 4620 
ttgaaaaaac tgatcgaaaa ataccgctgc 4680 
aaggtatata agctggtggg agaaaatgaa 4740 
tataaaggga ccacctatga tgtggaacgg 4800 
aagctgcctg ttccaaaggt cctgcacttt 4860 
atgagtgagg ccgatggcgt cctttgctcg 4920 
aagattatcg agctgtatgc ggagtgcatc 4980 
tgtccctata cgaatagctt agacagccgc 5040 
gatctggccg atgtggattg cgaaaactgg 5100 
gagctgtatg attttttaaa gacggaaaag 5160 
gacctgggag acagcaacat ctttgtgaaa 522 0 
gggagaagcg gcagggcgga caagtggtat 52 80 
gaggatatcg gggaagaaca gtatgtcgag 5340 
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ctattttttg acttactggg gatcaagcct gattgggaga aaataaaata ttatatttta 5400 
ctggatgaat tgttttagta cctagatgtg gcgcaacgat gccggcgaca agcaggagcg 5460 
caccgacttc ttccgcatca agtgttttgg ctctcaggcc gaggcccacg gcaagtattt 5520 
gggcaagggg tcgctggtat tcgtgcaggg caagattcgg aataccaagt acgagaagga 5580 
cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa 5640 
ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat 5700 
cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat 57 60 
cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc 5820 
gccccgcgaa accttccagt ccgtcggctc gatggtccag caagctacgg ccaagatcga 5880 
gcgcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg 5940 
ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag . tcgatgacca tcgacacgcg 6000 
aggaactatg acgaccaaga- agcgaaaaac cgccggcgag gacctggcaa aacaggtcag 6060 
cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct 6120 
ttccttgttc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa acgacacggc 6180 
ccgctctgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa 6240 
ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc 6300 
cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg 6360 
cgagccgatc accttcacgt • tctacgagct ttgccaggac ctgggctggt cgatcaatgg 6420 
ccggtattac acgaaggccg aggaatgcct gtcgcgccta- caggcgacgg cgatgggctt 6480 
cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct 6540 
ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct 6600 
gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac 6660 
ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga 6720 
aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt 6780 
cggcgaagcc tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga 6840 
tgacctggtg cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc 6900 
agccagcgct ttactggcat ttcaggaaca- agcgggcact gctcgacgca cttgcttcgc 6960 
tcagtatcgc tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa 7020 
ttgacaattg tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc 7080 
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cgcg.agatcc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggacggcccG 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggc 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt 


tattgctcgt 


gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc 


acttaatatt 


7440 


tcgctattct 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttcatct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 


gtgttgacac 


caaacgcagc 


gctagatcct 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 


gtttccatgg 


egtfccggaac 


cgtgctgacc 


cgcaagtggc 


aacctcccgt 


gcctctgctc 


7740 


acctttaccg 


cctggcaact 


ggcggccgga 


ggacttctgc 


tcgttccagt 


agctttagtg 


7800 


tttgatccgc 


caatcccgat 


gcctacagga 


accaatgttc 


tcggcctggc 


gtggctcggc 


7860 


ctgatcggag 


cgggtttaac 


"ctacttcctt 


tggttccggg 


ggatctcgcg' 


actcgaacct 


7920 


acagttgttt 


ccttactggg 


ctttctcagc 


cccagatctg 


gggtcgatca 


gccggggatg 


7980 


catcaggccg 


acagtcggaa 


cttcgggtcc 


ccgacctgta 


ccattcggtg 


agcaatggat 


8040 


aggggagttg 


atatcgtcaa 


cgttcacttc 


taaagaaata 


gcgccactca 


gcttcctcag 


8100 


cggctttatc 


cagcgatttc 


ctattatgtc 


ggcatagttc 


tcaagatcga 


cagcctgtca 


8160 


cggttaagcg 


agaaatgaat 


aagaaggctg 


ataattcgga 


tctctgcgag 


ggagatgata 


8220 


tttgatcaca 


ggcagcaacg 


ctctgtcatc 


gttacaatca 


acatgctacc 


ctccgcgaga 


8280 


tcatccgtgt 


ttcaaacccg 


gcagcttagt 


tgccgttctt 


ccgaatagca 


tcggtaacat 


8340 


gagcaaagtc 


tgccgcctta 


caacggctct 


cccgctgacg 


ccgtcccgga 


ctgatgggct 


8400 


gcctgtatcg 


agtggtgatt 


ttgtgccgag 


ctgccggtcg 


gggagctgtt 


ggctggctgg 


8460 


tggcaggata 


tattgt'ggtg 


taaacaaatt 


gacgcttaga 


caacttaata 


acacattgcg 


8520 


gacgttttta 


atgtactggg 


gtggtttttc 


ttttcaccag 


tgagacgggc 


aacagctgat 


8580 


tgcccttcac 


cgcctggccc 


tgagagagtt 


gcagcaagcg 


gtccacgctg 


gtttgcccca 


8640 


gcaggcgaaa 


atcctgtttg 


atggtggttc 


cgaaatcggc 


aaaatccctt 


ataaatcaaa 


8700 


agaatagccc 


gagatagggt 


tgagtgttgt 


tccagtttgg 


aacaagagtc 


cactattaaa 


8760 


gaacgtggac 


tccaacgtca 


aagggcgaaa 


aaccgtctat 


cagggcgatg 


gcGcactacg 


8820 
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tgaaccatca 


cccaaatcaa 


gttttttggg 


gtcgaggtgc 


cgtaaagcac 


taaatcggaa 


8880 


ccctaaaggg 


agcccccgat 


ttagagcttg 


acggggaaag 


ccggcgaacg 


tggcgagaaa 


8940 


ggaagggaag 


aaagcgaaag 


gagcgggcgc 


cattcaggct 


gcgcaactgt 


tgggaagggc 


9000 


gatcggtgcg 


ggcctcttcg 


ctattacgcc 


agctggcgaa 


agggggatgt 


gctgcaaggc 


9060 


gattaagttg 


ggtaacgcca 


gggttttccc 


agtcacgacg 


ttgtaaaacg 


acggccagtg 


9120 


aattaattcc 


catcttgaaa 


gaaatatagt 


'ttaaatattt 


attgataaaa 


taacaagtca 


9180 


ggtattatag 


tccaagcaaa 


aacataaatt 


tattgatgca 


agtttaaatt 


cagaaatatt 


9240 


tcaataactg 


attatatcag 


ctggtacatt 


gccgtagatg 


aaagactgag 


tgcgatatta 


9300 


tgtgtaatac 


ataaattgat 


gatatagcta 


gcttagctca 


tcgggggatc 


cgtcgaagct 


9360 . 


agcttgggtc 


ccgctcagaa 


gaactcgtca 


agaaggcgat 


agaaggcgat 


gcgctgcgaa 


9420 


tcgggagcgg 


cgataccgta 


aagcacgagg 


aagcggtcag 


cccattcgcc 


gccaagctct 


9480 


tcagcaatat 


cacgggtagc 


caacgctatg 


tcctgatagc 


ggtccgccac 


acccagccgg 


9540 


ccacagtcga 


tgaatccaga 


aaagcggcca 


ttttccacca 


tgatattcgg 


caagcaggca 


9600 


tcgccatggg 


tcacgacgag 


atcctcgccg 


tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 


agttcggctg 


gcgcgagccc 


ctgatgctct 


tcgtccagat 


catcctgatc 


gacaagaccg 


9720 


gcttccatcc 


gagtacgtgc 


tcgctcgatg 


cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 


gtagccggat 


caagcgtatg 


cagccgccgc 


attgcatcag 


ccatgatgga 


tactttctcg 


9840 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


acagctgcgc 


aaggaacgcc 


cgtcgtggcG 


9960' 


agccacgata . 


gccgcgctgc 


ctcgtcctgc 


agttcattca 


gggcaccgga 


caggtcggtc 


10020 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


ccgattgtct 


gttgtgccca 


gtcatagccg 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


tctggattga 


gagtgaatat 


gagactctaa 


ttggataccg 


aggggaattt 


atggaacgtc 


10260 


agtggagcat 


ttttgacaag 


aaatatttgc 


tagctgatag 


tgaccttagg 


cgacttttga 


10320 


acgcgcaata 


atggtttctg 


acgtatgtgc 


ttagctcatt 


aaactccaga 


aacccgcggc 


10380 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


gcgccatcag 


atccttggcg 


gcaagaaagc 


catccagttt 


actttgcagg 


gcttcccaac 


10560 
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cttaccagag 


ggcgccccag 


ctggcaattc 


cggttcgctt 


-gctgtccata 


aaaccgccca 


10620 


gtctagctat 


cgccatgtaa 


gcccactgca 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


ttcccttgtc 


cagatagccc 


agtagctgac 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


actggctttc 


tacgtgttcc 


gcttccttta 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


attgccacta 


aacgtctaaa 


cccttgtaat 


ttgtttttgt' 


tttactatgt 


gtgttatgta 


10920 


tttgatttgc 


gataaatttt 


tatatttggt 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


tttgccaaca 


cttagcaatt 


tgcaagttga 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aaatacatat 


actaatcaac 


tggaaatgta 


aatatttgct 


aatatttcta 


ctataggaga 


11100 


attaaagtga 


gtgaatatgg 


taccacaagg 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


ggatggcata 


tacaccaaac 


attcaataat 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


taccacacac 


aagttttgag 


gtgcatgcat 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aaaccatgac 


atccacttgg 


aggatgcaat 


11400 


aatgaagaaa 


actacaaatt 


tacatgcaac 


tagttatgca 


tgtagtctat. 


ataatgagga 


11460 


ttttgcaata 


ctttcattca 


t^cacactca 


ctaagtttta 


cacgattata 


atttcttcat 


11520 


agccagccca 


ccgcggtggg 


cggccgcctg 


cagtctagaa 


ggcctcctgc 


tttaatgaga 


11580 


tatgcgagac 


gcctatgatc 


gcatgatatt 


tgctttcaat 


tctgttgtgc 


acgttgtaaia 


11640 


aaacctgagc 


atgtgtagct 


cagatcctta 


ccgccggttt- 


cggttcattc 


taatgaatat 


11700 


atcacccgtt 


actatcgtat 


ttttatgaat 


aatattctcc 


gttcaattta 


ctgattgtcc 


11760 


gtcgagcaaa 


tttacacatt 


gccactaaac 


gtctaaaccc 


ttgtaatttg 


tttttgtttt 


11820 


actatgtgtg 


ttatgtattt 


gatttgcgat 


aaatttttat 


atttggtact 


aaatttataa 


11880 


caccttttat 


gctaacgttt 


gccaacactt 


agcaatttgc 


aagttgatta 


attgattcta 


11940 


aattattttt 


gtcttctaaa 


tacatatact 


aatcaactgg 


aaatgtaaat 


atttgctaat 


12000 


atttctacta 


taggagaatt 


aaagtgagtg 


aatatggtac 


cacaaggttt 


ggagatttaa 


12060 


ttgttgcaat 


gctgcatgga 


tggcatatac 


accaaacatt 


caataattct 


tgaggataat 


12120 


aatggtacca 


cacaagattt 


gaggtgcatg 


aacgtcacgt 


ggacaaaagg 


tttagtaatt 


12180 


tttcaagaca 


acaatgttac 


cacacacaag 


ttttgaggtg 


catgcatgga 


tgccctgtgg 


12240 


aaagtttaaa 


aatattttgg 


aaatgatttg 


catggaagcc 


atgtgtaaaa 


ccatgacatc 


12300 
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cacttggagg 


atgcaataat 


gaagaaaact 


acaaatttac 


atgcaactag 


ttatgcatgt 


12360 


agtctatata 


atgaggattt 


tgcaatactt 


tcattcatac 


acactcacta 


agttttacac 


12420 


gattataatt 


• tcttcatagc 


cagcggatcc 


gatatcgggc 


ccgctagcgt 


taaccctgct 


12480 


ttaatgagat 


atgcgagacg 


cctatgatcg 


catgatattt 


gctttcaatt 


ctgttgtgca 


12540 


cgttgtaaaa 


aacctgagca 


tgtgtagctc 


agatccttac 


cgccggtttc 


ggttcattct 


12600 


aatgaatata 


tcacccgtta. 


ctatcgtafct 


tttatgaata 


atattctccg 


ttcaatttac 


12660 


tgattgtccg 


tcgacgaatt 


cgagctcggc 


gcgcctctag 


aggatcgatg 


aattcagatc 


12720 


ggctgagtgg 


ctccttcaac. 


gttgcggttc 


tgtcagttcc 


aaacgtaaaa 


cggcttgtcc 


12780 


cgcgtcatcg 


gcgggggtca 


taacgtgact 


cccttaattc 


tccgctcatg 


atcagattgt 


12840 


cgtttcccgc 


cttcagttta 


aactatcagt 


gtttgacagg 


atatattggc 


gggtaaacct 


12900 


aagagaaaag 


agcgtttatt 


agaataatcg 


gatatttaaa 


agggcgtgaa 


aaggtttatc 


12960 


cttcgtccat 


ttgtatgtgc 


atgccaacca 


cagggttccc 


ca 
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<400> 24 
gatctggcgc 


cggccagcga 


gacgagcaag 


attggccgcc 


gcccgaaacg 


atccgacagc 


60 


gcgcccagba 


caggtgcgca 


ggcaaattgc. 


accaacgcat 


acagcgccag 


cagaatgcca 


12 0 


tagtgggcgg 


tgacgtcgtt 


cgagtgaacc 


agatcgcgca 


ggaggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgatgccgac 


agcgtcgagc 


gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt 


tcacgtctgg 


cctccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca 


ctgataagtt 


ggtggacata 


•ttatgtttat 


cagtigataaa 


gtgtcaagca 


360 


tgacaaagtt 


gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca 


cgcaaactgg cggaacggtt 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg cgatggc^cg cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 



gcgaggcggg tttttcggcc ggggacgccg 
ctgttggggc cgtgcttgag gagcaggccg 
ccgttgaaca ggctccgctc tcgccgctgt 
ccggtccgga cgcagcgttc gagcagggac 
ggaggctcgt tgtcaggaac gttgaaggac 
tgccggagcg caacccactc actacagcag 
Gcaccgcgtc agacgcccgt agcagcccgc 
ccaagcctca cggccgcgct cggcctctct 
gctcactgac tcgctgcgct cggtcgttcg 
ggcggtaata cggttatcca cagaatcagg 
aggccagcaa aaggccagga accgtaaaaa 
ccgcccccct ga.cga.gca.tc acaaaaatcg 
aggactataa agataccagg cgtttccccc 
gaccctgccg cttaccggat acctgtccgc 
ccgctgcata accctgcttc ggggtcatta 
tcgcacgata tacaggattt tgccaaaggg 
ggcgtcagcc gggcaggata ggtgaagtag 
ctgtccctta ttcgcacctg gcggtgctca 
ctaccgccgg cgtaacagat gagggcaagc 
agggcagccc acctatcaag gtgtactgcc 
aggcggcggc ggccggcatg agcctgtcgg 
aaatcacggg cgtcgtggac tatgagcacg 
tgggccgcct gggcggcctg ctgaaactct 
tcggtgatgc cacgatcctc gccctgctgg 
gcaaggtcat gatgggcgtg gtccgcccga 
aacggccggg gggtgcgcgt gattgccaag 
gacttcgcgg agctggtgaa gtacatcacc 
gacgctcacc gggctggttg ccctcgccgc 
cgcgccagaa a'cgccgtcga agccgtgtgc 
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tcaatgcgct gatgacaatc agctacttca 780 
gcgacagcga tgccggcgag cgcggcggca 840 
tgcgggccgc gatagacgcc .ttcgacgaag 900 
tcgcggtgat tgtcgatgga ttggcgaaaa 960 
cgagaaaggg tgacgattga tcaggaccgc 1020 
agccatgtag acaacatccc ctcccccttt 1080 
tacgggcttt ttcatgccct gccctagcgt 1140 
ggcggccttc tggcgctctt ccgcttcctc 1200 
gctgcggcga gcggtatcag ctcactcaaa 12 60 
ggataacgca ggaaagaaca tgtgagcaaa 1320 
ggccgcgttg ctggcgtttt tccataggct 1380 
acgctcaagt cagaggtggc gaaacccgac 1440 
tggaagctcc ctcgtgcgct ctcctgttcc 1500 
ctttctccct tcgggaagcg tggcgctttt 1560 
tagcgatttt ttcggtatat ccatcctttt' 1620 
ttcgtgtaga ctttccttgg tgtatccaac 1680 
gcccacccgc gagcgggtgt tccttcttca 1740 
acgggaatcc. tgctctgcga ggctggccgg 1800 
ggatggctga tgaaaccaag ccaaccagga 1860 
ttccagacga acgaagagcg attgaggaaa 192 0 
cctacctgct ggccgtcggc cagggctaca 1980 
tccgcgagct ggcccgcatc aatggcgacc 2 040 
ggctcaccga cgacccgcgc acggcgcggt 2100 
cgaagatcga agagaagcag gacgagcttg 2160 
gggcagagcc atgacttttt tagccgctaa 2220 
cacgtcccca tgcgctccat caagaagagc 2280 
gacgagcaag gcaagaccga gcgcctttgc .2340 
tgggctggcg gccgtctatg gccctgcaaa 2400 
gagacaccgc ggccgccggc gttgtggata 2460 
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cctcgcggaa 


aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gagctggcca 


gcctcgcaaa 


tcggcgaaaa 


cgcctgattt 


tacgcgagtt 


tcccacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgacagatga 


ggggcgcgat 


ccttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 


ccgcccgttt 


ttcggccacc 


gctaacctgt 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


acgggatggg 


cgatcagccc 


gagcgcgacg 


cccggaLagca 


3120 


ttgacgtgcc 


gcaggtgctg 


gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaattgga 


cctttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


aggcagcgcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acalgcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttcc 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


cgtgttgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 
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catatcaatg 


attttctggt 


gcgtaccggg 


ttgagaagcg 


gtgtaagtga 


actgcagt-tg 




ccatgtttta 


cggcagtgag 


agcagagata 


gcgctgatgt 


ccggcggtgc 


ttttgccgfct 


yl O O 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


gggacagctg 


atagacacag 


aagccactgg 


4380 


agcacctcaa 


aaacaccatc 


atacactaaa 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 


tggtttcaaa . 


. atcggctccg 


tcgatactat 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


aaaagctgtt , 


ttctggtatt 


taaggtttta 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 


cttgttataa 


ttagcttctt 


ggggtatctt 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


taaatggcta 


aaatg-agaat 


atcaccggaa 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


gtaaaagata 


cggaaggaat . 


gtctcctgct 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


aacctatatt 


taaaaatgac 


ggacagccgg 


tataaaggga 


ccacctatga 


tgt ggaacgg 


A o r\ r\ 

4800 


gaaaaggaca 


tgatgctatg 


gctggaagga 


aagctgcctg 


ttccaaaggt 


cctgcacttfc 


/I o /T r\ 

4860 


gaacggcatg 


atggctggag 


caatctgctc 


atgagtgagg 


ccgatggcgt 


cctttgctcg 


/I o n 

4320 


gaagagtatg 


aagatgaaca 


aagccctgaa 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


aggctctttc 


actccatcga 


catatcggat 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


ttagccgaat 


tggattactt 


actgaataac 


gatctggccg 


atgtggattg 


cgaaaactgg 


5100 


gaagaagaca 


ctccatttaa 


agatccgcgc 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gatggcaaag 


taagtggctt 


tattgatctt 


gggagaagcg 


gcagggcgga 


caagtggtat 


5280 


gacattgcct 


tctgcgtccg 


gtcgatcagg 


gaggatatcg 


ggga^agaaca 


gtatgtcgag 


5340 


ctattttttg 


acttactggg 


gatcaagcct 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


caccgacttc 


ttccgcatca 


agtgttttgg 


ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 


ggcaccaggc 


gggtcaaatc 


aggaataagg 


gcacattgcc 


ccggcgtgag 


tcggggcaat 


5700 


cccgcaagga 


ggatgaatga 


atcggacgtt 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggafcgccga 


aaccatcgca 


agccgcaccg 


tcatgcgtgc 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


caagctacgg 


ccaagatcga 


5880 


gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 
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tcgctattct 


ggagcttgtt 


gtttatttcg 
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tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcG 


gctgatggtc 


gtgttcatct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 


gtgttgacac 


caaacgcagc 


gctagatcct 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 



gtttccatgg cgttcggaac cgtgctgacc 
acctttaccg cctggcaact ggcggccgga 
tttgatccgc caatcccgat gcctacagga 
ctgatcggag cgggtttaac ctacttcctt 
acagttgttt ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaagcg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg. ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaaaggg agcccccgat ttagagcttg 
ggaagggaag aaagcgaaag gagcgggcgc 
gatcggtgcg ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 
aattaattcc catcttgaaa gaaatatagt 
ggtattatag tccaagcaaa aacataaatt 
tcaataactg attatatcag ctggtacatt 
tgtgtaatac ataaattgat gatatagcta 
agcttgggtc ccgctcagaa gaactcgtca 
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cgcaagtggc aacctcccgt gcctctgctc 7740 
ggacttctgc tcgttccagt agctttagtg 7800 
accaatgttc tcggcctggc gtggctcggc 7860 
tggttccggg- ggatctcgcg actcgaacct 7920- 
cccagatctg gggtcgatca gccggggatg 7980 
ccgacctgta ccattcggtg agcaatggat 8040 
taaagaaata gcgccactca gcttcctcag 8100 
ggcatagttc tcaagatcga cagcctgtca 8160 
ataattcgga tctctgcgag ggagatgata 8220 
gttacaatca acatgctacc ctccgcgaga 8280 
tgccgttctt ccgaatagca tcggtaacat 8340 
cccgctgacg ccgtcccgga ctgatgggct 8400 
ctgccggtcg gggagctgtt ggctggctgg 8460 
gacgcttaga caacttaata acacattgcg 8520 
ttttcaccag tgagacgggc aacagctgat 8580 
gcagcaagcg gtccacgctg gtttgcccca 8640 
cgaaatcggc aaaatccctt ataaatcaaa 8700 
tccagtttgg aacaagagtc cactattaaa 8760 
aaccgtctat cagggcgatg gcccactacg 8820 
gtcgaggtgc cgtaaagcac taaatcggaa 8880 
acggggaaag ccggcgaacg tggcgagaaa 8940 
cattcaggct gcgcaactgt tgggaagggc 9000 
agctggcgaa agggggatgt gctgcaaggc 9060 
agtcacgacg ttgtaaaacg acggccagtg 9120 
ttaaatattt attgataaaa taacaagtca 9180 
tattgatgca agtttaaatt cagaaatatt 9240 
gccgtagatg aaagactgag tgcgatatta 9300 
gcttagctca tcgggggatc cgtcgaagct 9360 
agaaggcgat agaaggcgat gcgctgcgaa 9420 
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tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg cttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt atggaacgtc 10260 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 
gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 
ttcccttgtc cagatagccc agtagctgac attcafcccgg ggtcagcacc gtttctgcgg 10740 
actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgpggca 10800 
gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 108 60 
attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 
tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 
tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 
aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 
attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aatgctgcat 11160 
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ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 
tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 
taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 
tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 
aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 
ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 
agccagccca ccgcggtggg cggccgcctg cagtctagaa ggcctcctgc tttaatgaga 11580 
tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 11640 
aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 11700 
atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtcc 11760 
gtcgagcaaa tttacacatt gccactaaac gtctaaaccc ttgtaatttg tttttgtttt 11820 
actatgtgtg ttatgtattt gatttgcgat aaatttttat atttggtact aaatttataa 11-880 
caccttttat gctaacgttt gccaacactt agcaatttgc aagttgatta attgattcta 11940 
aattattttt gtcttctaaa tacatatact aatcaactgg aaatgtaaat atttgctaat 12000 
atttctacta taggagaatt aaagtgagtg aatatggtac cacaaggttt ggagatttaa • 12060 
ttgttgcaat gctgcatgga tggcatatac accaaacatt caataattct tgaggataat 1212 0 
aatggtacca cacaagattt gaggtgcatg aacgtcacgt ggacaaaagg tttagtaatt 12180 
tttcaagaca acaatgttac cacacacaag ttttgaggtg catgcatgga tgccctgtgg 12240 
aaagtttaaa aatattttgg aaatgatttg catggaagcc atgtgtaaaa ccatgacatc 12300 
cacttggagg atgcaataat gaagaaaact acaaatttac atgcaactag ttatgcatgt 12360 
agtctatata atgaggattt tgcaatactt' tcattcatac acactcacta agttttacac 12420 
gattataatt tcttcatagc cagcggatcc gatatcgggc ccgctagcgt taaccctgct 12480 
ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca 12540 
cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct 12600 
aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaat-ttac 12660 
tgattgtccg tcgagcaaat ttacacattg ccactaaacg tctaaaccct tgtaatttgt 12720 
ttttgtttta ctatgtgtgt tatgtatttg atttgcgata aatttttata tttggtacta 12780 
aatttataac accttttatg ctaacgtttg ccaacactta gcaatttgca agttgattaa 12840 
ttgattctaa attatttttg tcttctaaat acatatacta atcaactgga aatgtaaata 12900 
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tttgctaata 


tttctactat 


aggagaatta 


aagtgagtga 


atatggtacc 


acaaggtttg 


12960 


gagatttaat 


tgttgcaatg 


ctgcatggat 


ggcatataca 


ccaaacattc 


aataattctt 


13020 


gaggataata 


atggtaccac 


acaagatttg 


aggtgcatga 


acgtcacgtg 


gacaaaaggt 


13080 


ttagtaattt 


ttcaagacaa 


caatgttacc 


acacacaagt 


tttgaggtgc 


atgcatggat 


13140 


gcGctgtgga 


aagtttaaaa 


atattttgga 


aatgatttgc 


atggaagcca 


tgtgtaaaac 


13200 


catgacatcc 


acttggagga 


tgcaataatg 


aagaaaacta 


caaatttaca 


tgcaactagt 


.13260 


tatgcatgta 


gtctatataa 


tgaggatttt 


gcaatacttt 


cattcataca 


cactcactaa 


13320 


gttttacacg 


attataattt 


cttcatagcc 


agcagatctg 


ccggcatcga 


tcccgggcca 


13380 


tggcctgctt 


taatgagata 


tgcgagacgc 


ctatgatcgc 


atgatatttg 


ctttcaattc 


13440" 


tgttgtgcac 


gttgtaaaaa 


acctgagcat 


gtgtagctca 


gatccttacc 


gccggtttcg 


13500 


gttcattcta 


atgaatatat 


cacccgttac 


tatcgtattt 


ttatgaataa 


tattctccgt 


13560 


tcaatttact 


gattgtccgt 


cgacgagctc 


ggcgcgcctc 


tagaggatcg 


atgaattcag 


13620 


atcggctgag 


tggctccttc 


aacgttgcgg 


ttctgtcagt 


tccaaacgta 


aaacggcttg 


13680 


tcccgcgtca 


tcggcggggg 


tcataacgtg 


actcccttaa 


ttctccgctc 


atgatcagat 


13740 


tgtcgtttcc 


cgccttcagt 


ttaaactatc 


agtgtttgac 


aggatatatt 


ggcgggtaaa 


13800 


cctaagagaa 


aagagcgttt 


attagaataa 


tcggatattt 


aaaagggcgt 


gaaaaggttt 


13860 


atccttcgtc 


catttgtatg 


' tgcatgccaa 


ccacagggtt 


cccca 




13905 



<210> 25 
<211> 15430 
<212> DNA 
<213> Unknown 

<220> 

<223> pflanz. Expressionsvektor mit zwei Promotor- 
Terminator-Expressionskassetten inseriert ist 
Physcomitrella patens Elongase tmd Desaturase 

<220> 
<221> CDS 

<222> (11543) . . (12415) 

<220> 
<221> CDS 

<222> (13313) (14890) 
<400> 25 

gatctggcgc cggccagcga gacgagcaag attggccgcc gcccgaaacg atccgacagc 60 



gcgcccagca caggtgcgca ggcaaattgc accaacgcat acagcgccag cagaatgcca. 120 



77 



tagtgggcgg 


tgacgtcgtt 


cgagtgaacc 


agatcgcgca 


ggaggcccgg 


cagcaccggc 


1 ft n 
_L 0 u 


ataatcaggc 


cgatgccgac 


agcgtcgagc 


gcgacagtgc 


tcagaattac 


gai-caggggt 


9 AH 


atgttgggtt 


tcacgtctgg 


GCtccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 




ttctttatca 


ctgataagtt 


ggtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


-5 DU 


tgacaaagtt 


gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggt eg 


0 n 


gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt 


gggggttcag 


cagccggcgc 


/ion 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 




cggagaatca 


tacgcattcg 


gtgccgagag 


ccgacgacga 


ctggcgctca 


uCT-cugaucg 


ouu 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


0 ou 


ccggcacgcg 


accgggcgca 


"ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


'Ton 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


•7 Q rv 


ctgttggggc 


cgtgctfcgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


o4bU 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


t fc cgac gaag 


0 A A 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggtgat 


tgtcgatgga 


tz tiggcgaaaa 


you 


gg'aggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


TATA 


tgccggagcg 


caacccactc 


ac tacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1 A Q n 


ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1 1 >! A 


ccaagcctca 


cggccgcgct 


cggcctctcfe 




tggcgctctt 


ccgcttcctc 


1 0 A A 


gctcactgac 


tcgctgcgct 


cggtcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1 0 A 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1 0 A 


aggccagcaa 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


"1 0 0 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


T /I yi A 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


-I C A 


ccgctgcata 


accctgcttc 


ggggt ca t ta 


tagcgatttt 


ctcggiiauac 




J. 0^ u 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 



agggcagccc acctatcaag gtgtactgcc 
aggcggcggc ggccggcatg agcctgtcgg 
aaatcacggg cgtcgtggac tatgagcacg 
tgggccgcct gggcggcctg ctgaaactct 
tcggtgatgc cacgatcctc gccctgctgg 
gcaaggtcat gatgggcgtg gtccgcccga 
aacggccggg gggtgcgcgt gattgccaag 
gacttcgcgg agctggtgaa gtacatcacc 
gacgctcacc gggctggttg ccctcgccgc 
cgcgccagaa acgccgtcga agccgtgtgc 
cctcgcggaa aacttggccc tcactgacag 
cgactcaccc ggcgcggcgt tgacagatga 
gagctggcca gcctcgcaaa tcggcgaaaa 
gatgtggaca agcctgggga taagtgccct 
tgacagatga ggggcgcgat ccttgacact 
gcacctattg acatttgagg ggctgtccac 
ccgcccgttt ttcggccacc gctaacctgt 
aaaccttgtt tttaaccagg gctgcgccct 
,tgccccccct tctcgaaccc tcccggcccg 
tgcgcccctc ggccgcgaac ggcctcaccc 
t.tgccgggat cggggcagta acgggatggg 
•ttgacgtgcc gcaggtgctg gcatcgacat 
gcggcctggg tggcggcctg cccttcactt 
cggggccggc aatttttacc ttgggcattc 
tgttcggggg tgcgataaac ccagcgaacc 
gtatgaaaac gagaattgga cctttacaga 
ctaccaagac gaagaggatg aagaggatga 
tactgataag ataatatatc ttttatatag 
ggcaaggcat aggcagcgcg cttatcaata 
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ttccagacga acgaagagcg attgaggaaa 1920 
cctacctgct ggccgtcggc cagggctaca 1980 
tccgcgagct ggcccgcatc aatggcgacc 2040 
ggctcaccga cgacccgcgc acggcgcggt 2100 
cgaagatcga agagaagcag gacgagcttg 2160 
gggcagagcc atgacttttt tagccgctaa 2220 
cacgtcccca tgcgctccat caagaagagc 2289 
gacgagcaag gcaagaccga gcgcctttgc 2340 
tgggctggcg gccgtctatg gccctgcaaa 2400 
gagacaccgc ggccgccggc gttgtggata 2460 
atgaggggcg gacgttgaca cttgaggggc 2520 
ggggcaggct cgatttcggc cggcgacgtg 2580 
cgcctgattt tacgcgagtt tcccacagat 2 640 
gcggtattga cacttgaggg gcgcgactac 2700 
tgaggggcag agtgctgaca gatgaggggc 2760 
aggcagaaaa tccagcattt gcaagggttt 2820 
cttttaacct gcttttaaac caatatttat 2880 
gtgcgcgtga ccgcgcacgc cgaagggggg 2940 
ctaacgcggg cctcccatcc ccccaggggc 3 000 
caaaaatggc agcgctggca gtccttgcca 3 060 
cgatcagccc gagcgcgacg cccggaagca 3120 
tcagcgacca ggtgccgggc agtgagggcg 3180 
cggccgtcgg ggcattcacg gacttcatgg 3240 
ttggcatagt ggtcgcgggt gccgtgctcg 3300 
atttgaggtg ataggtaaga ttataccgag 3360 
attactctat gaagcgccat atttaaaaag 3420 
ggaggcagat tgccttgaat atattgacaa 3480 
aagatatcgc cgtatgtaag gatttcaggg 3 540 
tatctataga atgggcaaag cataaaaact 3 600 



tgcatggact aatgcttgaa acccaggaca 
attgggtaat gactccaact tattgatagt 
tgtcatgcag ctccaccgat tttgagaacg 
gctgcctcag attcaggtta tgccgctcaa 
gcagctttcc cttcaggcgg gattcataca 
cgtcaaaggg tgacagcagg ctcataagac 
atacgtgcgc aacaaccgtc ttccggagac 
gcgatttagc cccgacatag ccccactgtt 
tgcccggctg tatgcgcgag gttaccgact 
cgtgttgagg* ccaacgccca taatgcgggc 
catatcaatg attttctggt gcgtaccggg 
ccatgtttta cggcagtgag agcagagata 
acgcaccacc ccgtcagtag ctgaacagga 
agcacctcaa aaacaccatc atacactaaa 
tggtttcaaa atcggctccg tcgatactat 
aaaagctgtt ttctggtatt taaggtttta 
cttgttataa ttagcttctt ggggtatctt 
taaatggcta aaatgagaat atcaccggaa 
gtaaaagata cggaaggaat gtctcctgct 
aacctatatt taaaaatgac ggacagccgg 
gaaaaggaca tgatgctatg gctggaagga 
gaacggcatg atggctggag caatctgctc 
gaagagtatg aagatgaaca aagccctgaa 
aggctctttc actccatcga catatcggat 
ttagccgaat tggattactt actgaataac 
gaagaagaca ctccatttaa agatccgcgc 
cccgaagagg aacttgtctt ttcccacggc 
gatggcaaag taagtggctt tattgatctt 
gacattgcct tctgcgtccg gtcgatcagg 
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ataaccttat agcttgtaaa ttctatcata 3660 
gttttatgtt cagataatgc ccgatgactt 3720 
acagcgactt ccgtcccagc cgtgccaggt 3780 
ttcgctgcgt atatcgcttg ctgattacgt 3840 
gcggccagcc atccgtcatc catatcacca 3900 
gccccagcgt cgccatagtg cgttcaccga 3960 
tgtcatacgc gtaaaacagc cagcgctggc 4020 
cgtccatttc cgcgcagacg atgacgtcac 4080 
gcggcctgag ttttttaagt . gacgtaaaat 4140 
tgttgcccgg catccaacgc cattcatggc 4200 
ttgagaagcg gtgtaagtga actgcagttg 4260 
gcgctgatgt ccggcggtgc ttttgccgtt 4320 
gggacagctg atagacacag aagccactgg 4380 
tcagtaagtt ggcagcatca cccataattg 4440 
gttatacgcc aactttgaaa acaactttga 4500 
gaatgcaagg aacagtgaat tggagttcgt 4560 
taaatactgt agaaaagagg aaggaaataa 4620 
ttgaaaaaac tgatcgaaaa ataccgctgc 4680 
aaggtatata agctggtggg agaaaatgaa 4740 
tataaaggga ccacctatga tgtggaacgg 4800 
aagctgcctg ttccaaaggt cctgcacttt 4860 
atgagtgagg ccgatggcgt cctttgctcg 4920 
aagattatcg agctgtatgc ggagtgcatc 4980 
tgtccctata cgaatagctt agacagccgc 5040 
gatctggccg atgtggattg cgaaaactgg 5100 
gagctgtatg attttttaaa gacggaaaag 5160 
gacctgggag acagcaacat ctttgtgaaa 5220 
gggagaagcg gcagggcgga caagtggtat 5280 
gaggatatcg gggaagaaca gtatgtcgag 5340 
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ctattttttg 


acttactggg 


gatcaagcct 


gattgggaga 


aaataaaata 


tcatatt uca 


c yi n n 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat 


Q'ccggcgaca 


age aggagc g 


b4oU 


caiccgacttc 


ttccgcatca 


agtgttttgg 


ctctcaggcc 


gaggcccacg 


gcaagtattt 




gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagat t egg 


aataccaagt 


a cgagaagga 


c c Q n 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag 


gtggattatc 


tggacaccaa 




ggcaccaggc 


gggtcaaatc 


aggaataagg 


gcacattgcc 


ccggcgtgag 


tcggggcaat 


c T A n 
3 /UU 


cccgcaagga 


gggtgaatga 


atcggacgtt 


tgaccggaag 


gcatacaggc 


aagaac t ga t 


o /oU 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg 


tcatgcgtgc 


poA U 


gccccgcgaa 


accttccagt 


Gcgtcggctc 


ga t gg t c c ag 


caagctacgg 


ccaagatcga. 


C Q Q r\ 


gcgcgacagc ■ 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgcggagcg 




ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


1 1 tggcgaag 


tcgatgacca 


tcgacacgcg 


OUUU 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gac c tggcaa 


aacaggtcag 


DU OU 


cgaggccaag 


caggccgcgt 


tgctgaaaca 


cacgaagcag 


cagafccaagg 


aaatgcagct 




ttccttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


oloO 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


fc gc aaaac aa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


d"! C\f\ 

D-3UU 


cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 




cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgafccaatgg 


A o r\ 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


64oU 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


ctgcaccgct 


tccgcgfccct 


D04(J 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgct 


^ ^ r\ A 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


c c c r\ 

boou 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc 


tcaagctgga 




aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagcaggt 


/r '7 o n 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga 


£ Q X A 


tgacctggtg 


cattgcaaac 


gctagggcct 


■ tgtggggtca 


gttccggctg 


ggggttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


7080 



cgcga.ga.tcc gattgtcggc cctgaagaaa 
cacgaggaga aaaagcccat ggaggcgttc 
ggcgcctaca tcgacggcga gatcattggg 
aaggacgctc acaaggcgca tctgtccggc 
ggggtcgccg gtatgctgct gcgggcgttg 
cgacagattc caacgggaat ctggtggatg 
tcgctattct ggagcttgtt gtttatttcg 
acggtaggcg ctgtgcagcc gctgatggtc 
ccgatacgat tgatggcggt cctgggggct 
gtgttgacac caaacgcagc gctagatcct 
gtttccatgg cgttcggaac cgtgctgacc 
acctttaccg cctggcaact ggcggccgga 
tttgatccgc caatcccgat gcctacagga 
ctgatcggag cgggtttaac ctacttcctt 
acagttgttt ccttactggg ctttctcagc 
catcaggccg acagtcggaa cttcgggtcc 
aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaageg agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
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gctccagaga tgttcgggtc cgtttacgag 7140 
gctgaacggt tgcgagatgc cgtggcattc 7200 
ctgtcggtct tcaaacagga ggacggcccc 72 60 
gttttcgtgg agcccgaaca gcgaggccga 7320 
ccggcgggtt tattgctcgt gatgatcgtc 7380 
cgcatcttca tcctcggcgc acttaatatt 7440 
gtctaccgcc tgccgggcgg ggtcgcggcg 7500 
gtgttcatct^ ctgccgctct gctaggtagc 7560 
atttgcggaa ctgcgggcgt ggcgctgttg 7 620 
gtcggcgtcg cagcgggcct ggcgggggcg 7680 
cgcaagtggc aacctcccgt gcctctgctc 7740 
ggacttctgc tcgttccagt agctttagtg 7800 
accaatgttc tcggcctggc gtggctcggc 7860 
tggttccggg ggatctcgcg actcgaacct 7920 
cccagatctg gggtcgatca gccggggatg 7980 
ccgacctgta ccattcggtg agcaatggat 8040 
taaagaaata gcgccactca gcttcctcag 8100 
ggcatagttc tcaagatcga cagcctgtca 8160 
ataattcgga tctctgcgag .ggagatgata 8220 
gttacaatca acatgctacc ctccgcgaga 8280 
tgccgttctt ccgaatagca tcggtaacat 8340 
cccgctgacg ccgtcccgga ctgatgggct 8400 
ctgccggtcg gggagctgtt ggctggctgg 8460 
gacgcttaga caacttaata acacattgcg 8520 
ttttcaccag tgagacgggc aacagctgat 8580 
gcagcaagcg gtccacgctg gtttgcccca 8640 
cgaaatcggc aaaatccctt ataaatcaaa 8700 
tccagtttgg aacaagagtc cactattaaa 8760 
aaccgtctat cagggcgatg gcccactacg 8820 
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tgaaccatca cccaaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 8880 
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 8940 
ggaagggaag aaagcgaaag gagcgggcgc cattcaggct gcgcaactgt tgggaagggc 9000 
gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc 9060 
gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg 9120 
aattaattcG catcttgaaa gaaatatagt ttaaatattt attgataaaa taacaagtca 9180 
ggtattatag tccaagcaaa aacataaatt tattgatgca agtttaaatt cagaaatatt 9240 
tcaataactg attatatcag ctggtacatt gccgtagatg aaagactgag tgcgatatta 9300 
tgtgtaa'tac ataaattgat gatatagcta gcttagctca tcgggggatc cgtcgaagct 93 60 
agcttgggtc ccgctcagaa gaactcgtca agaaggcgat agaaggcgat gcgctgcgaa 9420 
tcgggagcgg cgataccgta aagcacgagg aagcggtcag cccattcgcc gccaagctct 9480 
tcagcaatat cacgggtagc caacgctatg tcctgatagc ggtccgccac acccagccgg 9540 
ccacagtcga tgaatccaga aaagcggcca ttttccacca tgatattcgg caagcaggca 9600 
tcgccatggg tcacgacgag atcctcgccg tcgggcatgc gcgccttgag cctggcgaac 9660 
agttcggctg gcgcgagccc ctgatgctct tcgtccagat catcctgatc gacaagaccg 9720 
gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg cttggtggtc gaatgggcag 9780 
gtagccggat caagcgtatg cagccgccgc attgcatcag ccatgatgga tactttctcg 9840 
gcaggagcaa ggtgagatga caggagatcc tgccccggca cttcgcccaa tagcagccag 9900 
tcccttcccg Gttcagtgac aacgtcgagc acagctgcgc aaggaacgcc cgtcgtggcc 9960 
agccacgata gccgcgctgc ctcgtcctgc agttcattca gggcaccgga caggtcggtc 10020 
ttgacaaaaa gaaccgggcg cccctgcgct gaeagccgga acacggcggc atcagagcag 10080 
ccgattgtct gttgtgccca gtcatagccg aatagcctct ccacccaagc ggccggagaa 10140 
cctgcgtgca atccatcttg ttcaatccaa gctcccatgg gccctcgact agagtcgaga 10200 
tctggattga gagtgaatat gagactctaa ttggataccg aggggaattt " atggaacgtc 102 60 
agtggagcat ttttgacaag aaatatttgc tagctgatag tgaccttagg cgacttttga 10320 
acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccgcggc 10380 
tgagtggctc cttcaacgtt gcggttctgt cagttccaaa cgtaaaacgg cttgtcccgc 10440 
gtcatcggcg ggggtcataa cgtgactccc ttaattctcc gctcatgatc ttgatcccct 10500 
gcgccatcag atccttggcg gcaagaaagc catccagttt actttgcagg gcttcccaac 10560 
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cttaccagag ggcgccccag ctggcaattc cggttcgctt gctgtccata aaaccgccca 10620 

gtctagctat cgccatgtaa gcccactgca agctacctgc tttctctttg cgcttgcgtt 10680 

ttcccttgtc cagatagccc agtagctgac attcatccgg ggtcagcacc gtttctgcgg 10740 

actggctttc tacgtgttcc gcttccttta gcagcccttg cgccctgagt gcttgcggca 10800 

gcgtgaagct tgcatgcctg caggtcgacg gcgcgccgag ctcctcgagc aaatttacac 10860 

attgccacta aacgtctaaa cccttgtaat ttgtttttgt tttactatgt gtgttatgta 10920 

tttgatttgc gataaatttt tatatttggt actaaattta taacaccttt tatgctaacg 10980 

tttgccaaca cttagcaatt tgcaagttga ttaattgatt ctaaattatt tttgtcttct 11040 

aaatacatat actaatcaac tggaaatgta aatatttgct aatatttcta ctataggaga 11100 

attaaagtga gtgaatatgg taccacaagg tttggagatt taattgttgc aiatgctgcat 11160 

ggatggcata tacaccaaac attcaataat tcttgaggat aataatggta ccacacaaga 11220 

tttgaggtgc atgaacgtca cgtggacaaa aggtttagta atttttcaag acaacaatgt 11280 

taccacacac aagttttgag gtgcatgcat ggatgccctg tggaaagttt aaaaatattt 11340 

tggaaatgat ttgcatggaa gccatgtgta aaaccatgac atccacttgg aggatgcaat 11400 

aatgaagaaa actacaaatt tacatgcaac tagttatgca tgtagtctat ataatgagga 11460 

ttttgcaata ctttcattca tacacactca ctaagtttta cacgattata atttcttcat 11520 

agccagccca ccgcggtgga aa atg gag gtc gtg gag aga ttc tac ggt gag 11572 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu 
1 5 

ttg gat ggg aag gtc teg cag ggc gtg aat gca ttg 
Leu Asp Gly Lys Val 'Ser Gin Gly Val- Asn Ala Leu 

15 20 

ggg gtg gag ttg acg gat acg ccc act acc aaa ggc 
Gly Val Glu Leu Tlir Asp Thr Pro Thr Thr Lys Gly 
30 35 

gac agt ccc aca ccc ate gtc etc ggt gtt tct gta 
Asp Ser Pro Tlir Pro He Val Leu Gly Val Ser Val 
45 50 

gtc att gga ggg ctt ttg tgg ata aag gcc agg gat 
Val He Gly Gly Leu Leu Trp He Lys Ala Arg Asp 
60 65 70 

gcc teg gag cca ttt ttg ■ etc caa get ttg gtg ctt 
Ala Ser Glu Pro Phe Leu Leu Gin Ala Leu Val Leu 
75 80 85 

ttc tgt ttt geg etc agt ctg tat atg tge gtg ggc 



10 

ctg ggt agt ttt 11620 
Leu Gly Ser Phe 
25 

ttg ccc etc gtt 11668 
Leu Pro Leu Val 
40 

tac ttg act att . 11716 
Tyr Leu Thr He 
55 

ctg aaa ccg cgc 11764 
Leu Lys Pro Arg 



gtg cac aac ctg 11812 
Val His Asn Leu* 
90 

ate get tat cag 11860 
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Phe Cys Phe Ala Leu Ser Leu Tyr Met Cys Val Gly lle Ala Tyr Gin 

95 100 105 

get att acc tgg egg tac tct etc tgg ggc aat gca tac aat cct aaa 
Ala lie Thr Trp Arg Tyr Ser Leu Tirp Gly Asn Ala Tyr Asn Pro Lys 
110 115 120 



ttg get gee tgc ett cga agt age cca aag tta aaa aat aag tac ctt 
Leu Ala Ala Cys Leu Arg Ser Ser. Pro Lys Leu Lys Asn Lys Tyr Leu 
205 210 215 



11908 



eat aaa gag atg gcg att etg gta tac ttg ttc tac atg tct aag tac 11956 
His Lys Glu Met Ala lie Leu Val Tyr Leu Phe Tyr , Met Ser Lys Tyr 
. 125 130 135 

gtg gaa ttc atg gat acc gtt ate atg ata etg aag cgc age acc agg 12004 
Val Glu Phe Met Asp Thr Val lie Met He Leu Lys Arg Ser Thr Arg 
140 145 150 

caa ata age ttc etc cae gtt tat cat cat tct tea att tec etc att 
Gin He Ser Phe Leu His Val Tyr His His Ser Ser He Ser Leu He 
155 160 * 165 ^ 170 

tgg tgg get att ' get cat cae get cct ggc ggt gaa gca tat tgg tct 
Trp Trp Ala He Ala His His Ala Pro Gly Gly Glu Ala Tyr Trp Ser 
175 180 185 

gcg get etg aac tea gga gtg eat gtt etc atg tat gcg tat tac ttc 12148 
Ala Ala Leu Asn Ser Gly Val His Val Leu Met Tyr Ala Tyr Tyr Phe 
190 195 200 



12052 



12100 



12196 



ttt tgg ggc agg tac ttg aca caa ttc caa atg ttc cag ttt atg etg 12244 
Phe Trp Gly Arg Tyr Leu Thr Gin Phe Gin Met Phe Gin Phe Met Leu 
220 225 230 

aac tta gtg cag get tac tac gae atg aaa aeg aat gcg cca tat cca 12292 
Asn Leu Val Gin Ala Tyr Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro 
235 240 245 250 

caa tgg etg ate aag att ttg ttc tac tac atg ate teg ttg etg ttt 
Gin Trp Leu He Lys He Leu Phe Tyr. Tyr Met He Ser Leu Leu Phe 
255 260 265 

Gtt ttc ggc aat ttt tac gta . caa aaa tac ate aaa ccc tct gae gga 
Leu Phe Gly Asn Phe Tyr Val Gin Lys Tyr He Lys Pro Ser Asp Gly 
270 275 280 

aag caa- aag gga get aaa act gag tga tctagaaggc ctcctgcttt 12435 
Lys Gin Lys Gly Ala Lys Thr Glu 
285 290 

aatgagatat gcgagacgcc tatgategca tgatatttgc tttcaattct gttgtgcacg 12495 

ttgtaaaaaa ectgageatg tgtagetcag atecttaccg ccggtttegg ttcattctaa 12555 

tgaatatate acccgttact atcgtatttt tatgaataat attctcegtt , caatttactg 12 615 



12340 



12388 



attgtccgtc gagcaaattt acacattgee actaaaegtc taaacccttg taatttgttt 12675 
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ttgttttact 


atgtgtgtta 


tgtatttgat 


ttgcgataaa 


tttttatatt 


tggtactaaa 


12735 


tttataacac 


cttttatgct 


aacgtttgcc 


aacacttagc 


aatttgcaag 


ttgattaatt 


12795 


gattctaaat 


tatttttgtc 


ttctaaatac 


atatactaat 


caactggaaa 


tgtaaatatt 


12855 


tgctaatatt 


tcfcactatag 


gagaattaaa 


gtgagtgaat 


atggtaccac 


aaggtttgga 


12915 


gatttaattg 


ttgcaatgct 


gcatggatgg 


catatacacc 


aaacattcaa 


taattcttga 


12975 


ggataataat 


ggtaccacac 


aagdtttgag 


gtgcatgaac 


gtcacgtgga 


caaaaggttt 


13035 


agtaattttt 


caagacaaca 


atgttaccac 


acacaagttt 


tgaggtgcat 


gcatggatgc 


13095 


cctgtggaaa 


gtttaaaaat 


attttggaaa 


tgatttgcat 


ggaagccatg 


tgtaaaacca 


13155 


tgacatccac 


ttggaggatg 


caataatgaa 


•gaaaactaca 


aatttacatg 


caactagtta 


13215 


tgcatgtagt 


Gtatataatg 


aggattttgc 


aatactttca 


ttcatacaca 


ctcactaagt 


13275 


tttacacgat 


tataatttct 


tcatagccag 


cggatcc atg gta ttc gcg ggc ggt 


13330 



• Met Val Phe Ala Gly' Gly 
295 

gga ctt cag cag ggc tct ctc gaa gaa aac ate gac gtc gag cac att 13378 
Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn lie Asp Val Glu His lie 
300 305 310 

gcc agt atg tct etc ttc age gac ttc ttc agt tat gtg tct tea act 13426 
Ala Ser Met Ser Leu Phe Ser Asp Phe Phe Ser Tyr Val Ser Ser Thr 
315 320 325 

gtt ggt teg tgg age gta cac agt ata caa cct ttg aag cgc ctg acg 13474 
Val Gly Ser Trp Ser Val His Ser lie Gin Pro Leu Lys Arg Leu Thr . 
330 335 . ■ 340 345 

agt aag aag cgt gtt teg gaa age get gee gtg caa tgt ata tea get 13522 
Ser Lys Lys Arg Val Ser Glu Ser Ala Ala Val Gin Cys lie Ser Ala 
350 355 - 360 

gaa gtt cag aga aat teg agt ace cag gga act gcg gag gca etc gea 13570 
Glu Val Gin Arg Asn Ser Ser Thr Gin Gly Thr Ala Glu Ala Leu Ala 
365 370 l" 375 

gaa tea gtc gtg aag cce acg aga ega agg tea tct cag tgg aag aag 13 618 
Glu Ser Val Val Lys Pro Thr Arg Arg Arg Ser Ser Gin Trp Lys Lys 
380 385 390 

teg aca cac cce eta tea gaa gta gca gta cac aac aag cca age gat 13666 
Ser Thr His Pro Leu Ser Glu Val Ala Val His Asn Lys Pro Ser Asp 
395 400 405 

tge tgg att gtt gta aaa aac aag gtg tat gat gtt tec aat ttt gcg 13714 
Cys Trp lie Val Val Lys Asn Lys Val Tyr Asp Val Ser Asn Phe Ala 
410 415 420 425 * 

gac gag cat cce gga gga tea gtt att agt act tat ttt gga ega gac 13762 
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Asp Glu His Pro Gly Gly Ser Val lie Ser Tixr Tyr Phe Gly Arg Asp 
430 *. 435 440 

ggc aca gat gtt ttc tct agt ttt cat gca get tct aca tgg aaa att 13810 
Gly Thr Asp Val Phe Ser Ser Phe His Ala Ala Ser Thr Trp Lys lie 
' 445 450 455 

ctt caa gac ttt tac att ggt gac gtg gag agg gtg gag ccg act cca 13858 
Leu Gin Asp Phe Tyr lie Gly Asp Val Glu Arg Val Glu Pro Thr Pro 
460 465 470 

' ' Tj r ! ' 

gag ctg ctg aaa gat ttc cga gaa atg aga get ctt ttc ctg agg gag 13906 
Glu Leu Leu Lys Asp Phe Arg Glu Met Arg Ala Leu Phe Leu Arg Glu 
475 480 ' 485 

caa ctt ttc aaa agt teg aaa ttg tac tat gtt atg aag ctg etc acg 13954 
Gin Leu Phe Lys Ser Ser. Lys Leu Tyr Tyr Val Met Lys Leu Leu Thr 
490 495 500 505 • 

aat gtt get att ttt get gcg age att gca ata ata tgt tgg age aag 14002 
Asn Val Ala He Phe Ala Ala .Ser He Ala He He Cys Trp Ser Lys 
510 515 ' 520 

act att tea gcg gtt ttg get tea get tgt atg atg get ctg tgt ttc 14050 
.Thr He Ser Ala Val Leu Ala Ser Ala Cys Met Met Ala Leu Cys Phe 
525 530 535 

caa cag tgc gga tgg eta tec cat gat ttt etc cac aat cag gtg ttt 1409 8 
Gin Gin Cys Gly Trp Leu Ser His Asp Phe -Leu His Asn Gin Val Phe 
540 545 550 

gag aca ege tgg ctt aat gaa gtt gte ggg tat gtg ate ggc aac gee . 14146 
Glu Thr Arg Trp Leu Asn Glu Val Val Gly Tyr Val He Gly Asn Ala 
555 560 565 

gtt ctg ggg ttt agt aca ggg tgg tgg aag gag aag cat aac ctt eat 14194 
Val Leu Gly Phe Ser Thr - Gly Trp Trp Lys Glu Lys His Asn Leu His 
570 575 :\ 580 585 

eat get get' cca aat gaa" tgc gat cag act tac caa cca att gat gaa 14242 
His Ala Ala Pro Asn Glu Cys Asp Gin Thr Tyr Gin Pro He Asp Glu 
590 595 600 

gat att gat act etc ccc etc att gee tgg age aag gac ata ctg gee 14290 
Asp He Asp Thr Leu Pro Leu He Ala Trp Ser Lys Asp He Leu Ala 
605 610 615 

aca gtt gag aat aag aca ttc ttg cga ate etc caa tac cag eat ctg 1433 8 
Thr Val Glu Asn Lys Thr Phe Leu Arg He Leu Gin Tyr Gin His Leu 
620 625 ' 630 

ttc ttc atg ggt ctg tta ttt ttc gee cgt ggt agt .tgg etc ttt tgg 14386 
Phe Phe Met Gly Leu Leu Phe Phe Ala Arg Gly Ser Trp Leu Phe Trp . 
635 640 645 

!_ j 

age tgg aga tat acc tct aca gca gtg etc tea cet gte gac agg ttg 14434 
Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu Ser Pro Val Asp Arg Leu 
650 655 660 665 
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ttg gag aag gga act gtt ctg ttt cac tac ttt tgg ttc gtc ggg aca 14482 
Leu Glu Lys Gly Thr Val Leu Phe His Tyr Phe Trp Phe Val Gly Thr 
670 675 680 

gcg tgc tat ctt etc cct ggt tgg aag cca tta gta tgg atg gcg gtg 14530 
Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro Leu Val Trp Met Ala Val 
685 690 695 

act gag etc atg tec ggc atg ctg ctg ggc ttt gta ttt gta ctt age 14578 
Thr Glu Leu Met Ser Gly Met Leu Leu Gly Plie Val Phe Val Leu Ser 
700 705 710 

i f 

cac aat ggg atg gag gtt tat aat teg tct aaa gaa ttc gtg agt gca 1462 6 
His Asn Gly Met Glu Val Tyr Asn Ser Ser Lys Glu Phe Val Ser Ala 
715- 720 725 

cag ate gta- tec aca egg gat ate aaa gga aac ata ttc aac gae tgg 14674 
Gin lie Val Ser Thr Arg Asp lie Lys Gly Asn He Phe Asn Asp Trp 
730 735 740 745 

ttc act ggt ggc ctt aacagg caa ata gag cat cat ctt ttc cca aca 14722 
" Phe Thr Gly Gly Leu Asn Arg Gin He Glu His His Leu Phe Pro Thr 

750 755 . 760 

atg ccc agg cat aat tta aac aaa ata gca cct aga gtg gag gtg ttc 14770 
Met Pro Arg His Asn Leu Asn Lys He Ala Pro Arg Val Glu Val Phe 
765 770 775 

tgt aag aaa cac ggt ctg gtg tac gaa gae gta, tct att get ace ggc 14818 
Cys Lys Lys His Gly Leu Val" Tyr Glu Asp Val Ser He Ala Thr Gly 
780 785 790 

act tgc aag gtt ttg aaa gca ttg aag gaa gtc gcg gag get gcg gca 14866 
Thr Cys Lys Val Leu Lys Ala Leu Lys Glu Val Ala Glu Ala Ala Ala 
795 ' 800 805 

gag cag cat get ace ace • agt taa • getagegtta accctgettt aatgagatat 14920 
Glu Gin His Ala Thr Thr Ser 
810 815 

gcgagacgcc tatgatcgea tgatatttgc 

cc'tgagcatg tgtagcteag atecttaccg 

acccgttact ategtatttt tatgaataat 

gacgaattcg agctcggcgc gcctctagag 

ccttcaaegt tgcggttctg tcagttccaa 

gggggtcata acgtgactcc ettaattetc 

tcagtttaaa ctatcagtgt ttgacaggat 

cgtttattag aataategga tatttaaaag 

gtatgtgcat gceaaccaca gggttcccca 



tttcaattct gttgbgcacg ttgtaaaaaa 14980 
ccggtttcgg ttcattctaa tgaatatatc 15040 
attctccgtt caatttactg attgtccgtc 15100 
gatcgatgaa ttcagatcgg ctgagtggct 15160 
aegtaaaacg gcttgteecg cgtcatcgge 15220 
cgctcatgat cagattgtcg tttcccgcct 152 80 
atattggcgg gtaaacetaa gagaaaagag 15340 
ggcgtgaaaa ggtttatcct tcgtecattt 15400 

15430 
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<210> 26 
<211> 290 
<212> PRT 
<213> Unknown ■ 



<400> 26 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
15 10 15 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20-25 30 

Thr Pro Thr Thr Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro He 

35 -40 . 45 

Val Leu Gly Val Ser Val Tyr Leu Thr He Val He Gly Gly Leu Leu 
50 55 60 • 

Trp He Lys Ala Arg Asp Leu Lys .Pro Arg Ala Ser Glu Pro Phe Leu 
65 70 75 80 

Leu Gin Ala Leu Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 

85 90 95 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
115 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 13-5 140 

Val He Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu His 
145 150 155 160 

Val Tyr His His Ser Ser He- Ser Leu He Trp Trp Ala He Ala His 
165 170 175 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185 190 

Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 

Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 255 

Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn. Phe Tyr 
260 265 270 
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Val Gin Lys Tyr lie Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 



Tlir Glu 
290 



<210> 27 

<211> 525 
<212> PRT 
<213> Unknown 



<400> 27 

Met Val Phe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 

1 ' 5 . 10 ■ 15 

lie Asp Val Glu His lie Ala Ser Met Ser Leu Phe Ser Asp Phe Phe 
. 20 25 30 

Ser Tyr Val Ser Ser Thr Val Gly Ser Trp Ser Val His Ser He Gin 
35 '40 45" 

Pro Leu Lys Arg Leu Thr Ser. Lys Lys Arg Val Ser Glu Ser Ala Ala 
.50 55 60 

Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 
65 70 75 80 

Thr Ala Glu Ala Leu Ala Glu Ser Val Val Lys Pro Thr Arg Arg Arg 

85 90 95 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 105 110 

His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn ^ Lys Val Tyr- 
115 , 120 125 

Asp Val' Ser Asn Phe Ala Asp Glu" His Pro Gly Gly Ser Val He Ser ' 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 

" 145 . 150 155 ^ 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 185' 190 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
195 200 205 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 

He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
225 230 235 240 
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Met Met Ala Leu Cys Plie Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn.Glu Val Val Gly 
260 265 . 270 

Tyr Val lie Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 
275 280 285 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 

Tyr Gin Pro lie Asp Glu Asp lie Asp Thr Leu Pro Leu lie Ala Trp 
305 310 315 320 

Ser Lys Asp He Leu. Ala Thr Val Glu Asn Lys Thr Phe Leu Arg He 
325 330 335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 350 

Gly Ser Trp Leu Phe^Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
. 355 360 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 

370 375. 380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 ' 400 

Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

Lys Glu Phe Val Ser Ala Gin He Val Ser Thr Arg Asp He Lys Gly 
435 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
450 455 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470 475 480 

Pro Arg Val Glu Val Phe Cys. Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 

500 -,. 505 510 ;., 

'i i ( 

Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 ' 520 525 



<210> 28 
<211> 17752 
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<212> DNA 
<213> Unknown 

<220> 

<223> pflanz. Expressionsvektor mit 3 

Promotor— Terminator- Expressionskassetten 
inseriert mit Physcomitrella Elongase + Desaturase 
+ Phaeodactylum Desaturase 

<220> 
<221> CDS 

<222> (11543) . . (12415) 

<220> 
<221> CDS 

<222> (13313) . . (14890) 

<220> 
<221> CDS 

<222> (15791) . . (17200) 
<400> 28 



gatctggcgc 


cggccagcga 


gacgagcaag 


attggccgcc 


gcccgaaacg 


atccgacagc 


60 


gcgcccagca 


qaggtgcgca 


ggcaaattgc 


accaacgcat 


acagcgccag 


cagaatgcca 


120 


tagtgggcgg 


tgacgtcgtt 


cgagtgaacc 


agatcgcgca 


sro'a.ggcccgg 


cagcaccggc 


180 


ataatcaggc 


cgat gc cgac 


agcgtcgagc . 


gcgacagtgc 


tcagaattac 


gatcaggggt 


240 


atgttgggtt 


tcacgtctgg 


cctccggacc 


agcctccgct 


ggtccgattg 


aacgcgcgga 


300 


ttctttatca 


ctgataagtt 


gcrtggacata 


ttatgtttat 


cagtgataaa 


gtgtcaagca 


360 


tgacaaagtt 


gcagccgaat 


acagtgatcc 


gtgccgccct 


ggacctgttg 


aacgaggtcg 


420 


gcgtagacgg 


tctgacgaca 


cgcaaactgg 


cggaacggtt- 


gggggttcag 


cagccggcgc 


480 


tttactggca 


cttcaggaac 


aagcgggcgc 


tgctcgacgc 


actggccgaa 


gccatgctgg 


540 


cggagaatca 


tacgcattcg 


gtgccgagag ccgacgacga 


ctggcgctca 


tttctgatcg 


600 


ggaatgcccg 


cagcttcagg 


caggcgctgc 


tcgcctaccg 


cgatggcgcg 


cgcatccatg 


660 


ccggcacgcg 


accgggcgca 


ccgcagatgg 


aaacggccga 


cgcgcagctt 


cgcttcctct 


720 , 


gcgaggcggg 


tttttcggcc 


ggggacgccg 


tcaatgcgct 


gatgacaatc 


agctacttca 


780 


ctgttggggc 


cgtgcttgag 


gagcaggccg 


gcgacagcga 


tgccggcgag 


cgcggcggca 


840 


ccgttgaaca 


ggctccgctc 


tcgccgctgt 


tgcgggccgc 


gatagacgcc 


ttcgacgaag 


900 


ccggtccgga 


cgcagcgttc 


gagcagggac 


tcgcggrtgat 


tgtcgatgga 


ttggcgaaaa 


960 


ggaggctcgt 


tgtcaggaac 


gttgaaggac 


cgagaaaggg 


tgacgattga 


tcaggaccgc 


1020 


tgccggagcg 


caacccactc 


actacagcag 


agccatgtag 


acaacatccc 


ctcccccttt 


1080 
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ccaccgcgtc 


agacgcccgt 


agcagcccgc 


tacgggcttt 


ttcatgccct 


gccctagcgt 


1140 


ccaagcctca 


cggccgcgct 


cggcctctct 


ggcggccttc 


tggcgctctt 


ccgcttcctc 


1200 


gctcactgac 


tcgctgcgct 


cgg;tcgttcg 


gctgcggcga 


gcggtatcag 


ctcactcaaa 


1260 


ggcggtaata 


cggttatcca 


cagaatcagg 


ggataacgca 


ggaaagaaca 


tgtgagcaaa 


1320 


aggccagcaa* 


aaggccagga 


accgtaaaaa 


ggccgcgttg 


ctggcgtttt 


tccataggct 


1380 


ccgcccccct 


gacgagcatc 


acaaaaatcg 


acgctcaagt 


cagaggtggc 


gaaacccgac 


1440 


aggactataa 


agataccagg 


cgtttccccc 


tggaagctcc 


ctcgtgcgct 


ctcctgttcc 


1500 


gaccctgccg 


cttaccggat 


acctgtccgc 


ctttctccct 


tcgggaagcg 


tggcgctttt 


1560 


ccgctgcata 


accctgcttc 


ggggtcatta 


tagcgatttt 


ttcggtatat 


ccatcctttt 


1620 


tcgcacgata 


tacaggattt 


tgccaaaggg 


ttcgtgtaga 


ctttccttgg 


tgtatccaac 


1680 


ggcgtcagcc 


gggcaggata 


ggtgaagtag 


gcccacccgc 


gagcgggtgt 


tccttcttca 


1740 


ctgtccctta 


ttcgcacctg 


gcggtgctca 


acgggaatcc 


tgctctgcga 


ggctggccgg 


1800 


ctaccgccgg 


cgtaacagat 


gagggcaagc 


ggatggctga 


tgaaaccaag 


ccaaccagga 


1860 


agggcagccc 


acctatcaag 


gtgtactgcc 


. ttccagacga 


acgaagagcg 


attgaggaaa 


1920 


aggcggcggc 


ggccggcatg 


agcctgtcgg 


cctacctgct 


ggccgtcggc 


cagggctaca 


1980 


aaatcacggg. 


cgtcgtggac 


tatgagcacg 


tccgcgagct 


ggcccgcatc 


aatggcgacc 


2040 


tgggccgcct 


gggcggcctg 


ctgaaactct 


ggctcaccga 


cgacccgcgc 


acggcgcggt 


2100 


tcggtgatgc 


■cacgatcctc 


gccctgctgg 


cgaagatcga 


agagaagcag 


gacgagcttg 


2160 


gcaaggtcat 


gatgggcgtg 


gtccgcccga 


gggcagagcc 


atgacttttt 


tagccgctaa 


2220 


aacggccggg 


gggtgcgcgt 


gattgccaag 


cacgtcccca 


tgcgctccat 


caagaagagc 


2280 


gacttcgcgg 


agctggtgaa 


gtacatcacc 


gacgagcaag 


gcaagaccga 


gcgcctttgc 


2340 


gacgctcacc 


gggctggttg 


ccctcgccgc 


tgggctggcg 


gccgtctatg 


gccctgcaaa 


2400 


cgcgccagaa 


acgccgtcga 


agccgtgtgc 


gagacaccgc 


ggccgccggc 


gttgtggata 


2460 


cctcgcggaa 


"aacttggccc 


tcactgacag 


atgaggggcg 


gacgttgaca 


cttgaggggc 


2520 


cgactcaccc 


ggcgcggcgt 


tgacagatga 


ggggcaggct 


cgatttcggc 


cggcgacgtg 


2580 


gage t ggc c a 


gcctcgcaaa 


tcggcgaaaa 


cgcctgattt- 


tacgcgagtt 


tcccacagat 


2640 


gatgtggaca 


agcctgggga 


taagtgccct 


gcggtattga 


cacttgaggg 


gcgcgactac 


2700 


tgacagatga 


gggsrcgcgat 


cc ttgacact 


tgaggggcag 


agtgctgaca 


gatgaggggc 


2760 


gcacctattg 


acatttgagg 


ggctgtccac 


aggcagaaaa 


tccagcattt 


gcaagggttt 


2820 
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ccgcccgttt 


ttcggccacc 


gctaacctgt 


cttttaacct 


gcttttaaac 


caatatttat 


2880 


aaaccttgtt 


tttaaccagg 


gctgcgccct 


gtgcgcgtga 


ccgcgcacgc 


cgaagggggg 


2940 


tgccccccct 


tctcgaaccc 


tcccggcccg 


ctaacgcggg 


cctcccatcc 


ccccaggggc 


3000 


tgcgcccctc 


ggccgcgaac 


ggcctcaccc 


caaaaatggc 


agcgctggca 


gtccttgcca 


3060 


ttgccgggat 


cggggcagta 


a-cgggatggg 


cgatcagccc 


gagcgcgacg 


cccggaagca 


3120 


ttgacgtgcc 


gcaggtgctg 


.gcatcgacat 


tcagcgacca 


ggtgccgggc 


agtgagggcg 


3180 


gcggcctggg 


tggcggcctg 


cccttcactt 


cggccgtcgg 


ggcattcacg 


gacttcatgg 


3240 


cggggccggc 


aatttttacc 


ttgggcattc 


ttggcatagt 


ggtcgcgggt 


gccgtgctcg 


3300 


tgttcggggg 


tgcgataaac 


ccagcgaacc 


atttgaggtg 


ataggtaaga 


ttataccgag 


3360 


gtatgaaaac 


gagaattgga 


cetttacaga 


attactctat 


gaagcgccat 


atttaaaaag 


3420 


ctaccaagac 


gaagaggatg 


aagaggatga 


ggaggcagat 


tgccttgaat 


atattgacaa 


3480 


tactgataag 


ataatatatc 


ttttatatag 


aagatatcgc 


cgtatgtaag 


gatttcaggg 


3540 


ggcaaggcat 


aggcagcgcg 


cttatcaata 


tatctataga 


atgggcaaag 


cataaaaact 


3600 


tgcatggact 


aatgcttgaa 


acccaggaca 


ataaccttat 


agcttgtaaa 


ttctatcata 


3660 


attgggtaat 


gactccaact 


tattgatagt 


gttttatgtt 


cagataatgc 


ccgatgactt 


3720 


tgtcatgcag 


ctccaccgat 


tttgagaacg 


acagcgactt 


ccgtcccagc 


cgtgccaggt 


3780 


gctgcctcag 


attcaggtta 


tgccgctcaa 


ttcgctgcgt 


atatcgcttg 


ctgattacgt 


3840 


gcagctttCG 


cttcaggcgg 


gattcataca 


gcggccagcc 


atccgtcatc 


catatcacca 


3900 


cgtcaaaggg 


tgacagcagg 


ctcataagac 


gccccagcgt 


cgccatagtg 


cgttcaccga 


3960 


atacgtgcgc 


aacaaccgtc 


ttccggagac 


tgtcatacgc 


gtaaaacagc 


cagcgctggc 


4020 


gcgatttagc 


cccgacatag 


ccccactgtt 


cgtccatttc 


cgcgcagacg 


atgacgtcac 


4080 


tgcccggctg 


tatgcgcgag 


gttaccgact 


gcggcctgag 


ttttttaagt 


gacgtaaaat 


4140 


cgtgttgagg 


ccaacgccca 


taatgcgggc 


tgttgcccgg 


catccaacgc 


cattcatggc 


4200 


catatcaatg 


attttctggt 


gcgtaccggg 


ttgagaagcg 


gtgtaagtga 


actgcagttg 


4260 


ccatgtttta 


cggcagtgag 


agcagagata 


gcgctgatgt 


ccggcggtgc 


ttttgccgtt 


4320 


acgcaccacc 


ccgtcagtag 


ctgaacagga 


gggacagctg 


atagacacag 


aagccactgg 


4380 


agcacctcaa 


aaacaccatc 


atacactaaa 


tcagtaagtt 


ggcagcatca 


cccataattg 


4440 


tggtttcaaa 


atcggctccg 


tcgatactat 


gttatacgcc 


aactttgaaa 


acaactttga 


4500 


aaaagctgtt 


ttctggtatt 


taaggtttta 


gaatgcaagg 


aacagtgaat 


tggagttcgt 


4560 
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cttgttataa 


ttagcttctt 


ggggtatctt 


taaatactgt 


agaaaagagg 


aaggaaataa 


4620 


taaatggcta 


aaatgagaat 


atcaccggaa 


ttgaaaaaac 


tgatcgaaaa 


ataccgctgc 


4680 


gtaaaagata 


cggaaggaat 


gtctcctgct 


aaggtatata 


agctggtggg 


agaaaatgaa 


4740 


aacctatatt 


taaaaatgac 


ggacagccgg 


tataaaggga 


ccacctatga 


tgtggaacgg 


4800 


gaaaaggaca 


tgatgctatg 


gctggaagga 


aagctgcctg 


ttccaaaggt 


cctgcacttt 


4860 


gaacggcatg 


atggctggag 


caatctgctc 


atgagtgagg 


ccgatggcgt 


Gctttgctcg 


4920 


gaagagtatg 


aagatgaaca 


aagccctgaa 


aagattatcg 


agctgtatgc 


ggagtgcatc 


4980 


aggctctttc 


actccatcga 


catatcggat 


tgtccctata 


cgaatagctt 


agacagccgc 


5040 


ttagccgaat 


tggattactt 


actgaataac 


gatctggccg 


atgtggattg 


cgaaaactgg 


5100 


gaagaagaca 


ctccatttaa 


agate cgcgc 


gagctgtatg 


attttttaaa 


gacggaaaag 


5160 


cccgaagagg 


aacttgtctt 


ttcccacggc 


gacctgggag 


acagcaacat 


ctttgtgaaa 


5220 


gatggcaaag 


taagtggctt 


tattgatctt 


gggagaagcg 


gcagggcgga 


caagtggtat 


5280 


gacattgcct 


tctgcgtccg 


gtcgatcagg 


gaggatatcg 


gggaagaaca 


gtatgtcgag 


5340 


ctattttttg 


acttactggg 


gatcaagcct 


gattgggaga 


aaataaaata 


ttatatttta 


5400 


ctggatgaat 


tgttttagta 


cctagatgtg 


gcgcaacgat 


gccggcgaca 


agcaggagcg 


5460 


caccgacttc 


ttccgcatca 


agtgttttgg 


ctctcaggcc 


gaggcccacg 


gcaagtattt 


5520 


gggcaagggg 


tcgctggtat 


tcgtgcaggg 


caagattcgg 


aataccaagt 


acgagaagga 


5580 


cggccagacg 


gtctacggga 


ccgacttcat 


tgccgataag 


gtggattatc 


tggacaccaa 


5640 


ggcaccaggc 


gggtcaaatc 


aggaataagg 


gcacattgcc 


ccggcgtgag 


tcggggcaat 


5700 


cccgcaagga 


gg^tgaatga 


atcggacgtt 


tgaccggaag 


gcatacaggc 


aagaactgat 


5760 


cgacgcgggg 


ttttccgccg 


aggatgccga 


aaccatcgca 


agccgcaccg 


tcatgcgtgc . 


5820 


gccccgcgaa 


accttccagt 


ccgtcggctc 


gatggtccag 


caagctacgg 


ccaagatcga 


5880 


gcgcgacagc 


gtgcaactgg 


ctccccctgc 


cctgcccgcg 


ccatcggccg 


ccgtggagcg 


5940 


ttcgcgtcgt 


ctcgaacagg 


aggcggcagg 


tttggcgaag 


tcgatgacca 


tcgacacgcg 


6000 


aggaactatg 


acgaccaaga 


agcgaaaaac 


cgccggcgag 


gacctggcaa 


aacaggtcag 


6060 




c a crcrc r* err' cr fc 




\mr w y w^vti^ij y-* 


cacra tr'aacrcr 


aaa tcrcacf c fc 


6120 


ttCGttgttc 


gatattgcgc 


cgtggccgga 


cacgatgcga 


gcgatgccaa 


acgacacggc 


6180 


ccgctctgcc 


ctgttcacca 


cgcgcaacaa 


gaaaatcccg 


cgcgaggcgc 


tgcaaaacaa 


6240 


ggtcattttc 


cacgtcaaca 


aggacgtgaa 


gatcacctac 


accggcgtcg 


agctgcgggc 


6300 
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cgacgatgac 


gaactggtgt 


ggcagcaggt 


gttggagtac 


gcgaagcgca 


cccctatcgg 


6360 


cgagccgatc 


accttcacgt 


tctacgagct 


ttgccaggac 


ctgggctggt 


cgatcaatgg 


6420 


ccggtattac 


acgaaggccg 


aggaatgcct 


gtcgcgccta 


caggcgacgg 


cgatgggctt 


6480 


cacgtccgac 


cgcgttgggc 


acctggaatc 


ggtgtcgctg 


ctgcaccgct 


tccgcgtcct 


6540 


ggaccgtggc 


aagaaaacgt 


cccgttgcca 


ggtcctgatc 


gacgaggaaa 


tcgtcgtgct 


6600 


gtttgctggc 


gaccactaca 


cgaaattcat 


atgggagaag 


taccgcaagc 


tgtcgccgac 


6660 


ggcccgacgg 


atgttcgact 


atttcagctc 


gcaccgggag 


ccgtacccgc 


tcaagctgga 


6720 


aaccttccgc 


ctcatgtgcg 


gatcggattc 


cacccgcgtg 


aagaagtggc 


gcgagcaggt 


•6780 


cggcgaagcc 


tgcgaagagt 


tgcgaggcag 


cggcctggtg 


gaacacgcct 


gggtcaatga ■ 


6840 


tgacctggtg 


cattgcaaac 


gctagggcct 


tgtggggtca 


gttccggctg 


ggggttcagc 


6900 


agccagcgct 


ttactggcat 


ttcaggaaca 


agcgggcact 


gctcgacgca 


cttgcttcgc 


6960 


tcagtatcgc 


tcgggacgca 


cggcgcgctc 


tacgaactgc 


cgataaacag 


aggattaaaa 


7020 


ttgacaattg 


tgattaaggc 


tcagattcga 


cggcttggag 


cggccgacgt 


gcaggatttc 


7080 


cgcgagat cc 


gattgtcggc 


cctgaagaaa 


gctccagaga 


tgttcgggtc 


cgtttacgag 


7140 


cacgaggaga 


aaaagcccat 


ggaggcgttc 


gctgaacggt 


tgcgagatgc 


cgtggcattc 


7200 


ggcgcctaca 


tcgacggcga 


gatcattggg 


ctgtcggtct 


tcaaacagga 


ggacggcccc 


7260 


aaggacgctc 


acaaggcgca 


tctgtccggo 


gttttcgtgg 


agcccgaaca 


gcgaggccga 


7320 


ggggtcgccg 


gtatgctgct 


gcgggcgttg 


ccggcgggtt' 


tattgctcgt 


gatgatcgtc 


7380 


cgacagattc 


caacgggaat 


ctggtggatg 


cgcatcttca 


tcctcggcgc 


acttaatatt 


7440 


tcgctattct- 


ggagcttgtt 


gtttatttcg 


gtctaccgcc 


tgccgggcgg 


ggtcgcggcg 


7500 


acggtaggcg 


ctgtgcagcc 


gctgatggtc 


gtgttcatct 


ctgccgctct 


gctaggtagc 


7560 


ccgatacgat 


tgatggcggt 


cctgggggct 


atttgcggaa 


ctgcgggcgt 


ggcgctgttg 


7620 


gtgttgacac 


caaacgcagc 


gctagatcct 


gtcggcgtcg 


cagcgggcct 


ggcgggggcg 


7680 


gtttccatgg 


cgttcggaac 


cgtgctgacc 


cgcaagtggc 


aacctcccgt 


gcctctgctc 


7740 


acctttaccg 


Gctggcaact 


ggcggccgga 


ggacttctgc 


tcgttccagt 


agctttagtg 


7800 


tttgatccgc 


caatcccgat 


gcctacagga 


accaatgttc 


tcggcctggc 


gtggctcggc 


7860 


ctgatcggag 


cgggtttaac 


ctacttcctt 


tggttccggg 


ggatctcgcg 


actcgaacct 


7920 


acagttgttt 


Gcttactggg 


ctttctcagc 


cccagatctg 


gggtcgatca 


gccggggatg 


7980 


catcaggccg 


acagtcggaa 


cttcgggtcG 


ccgacctgta 


ccattcggtg 


agcaatggat 


8040 



aggggagttg atatcgtcaa cgttcacttc 
cggctttatc cagcgatttc ctattatgtc 
cggttaagcg .agaaatgaat aagaaggctg 
tttgatcaca ggcagcaacg ctctgtcatc 
tcatccgtgt ttcaaacccg gcagcttagt 
gagcaaagtc tgccgcctta caacggctct 
gcctgtatcg agtggtgatt ttgtgccgag 
tggcaggata tattgtggtg taaacaaatt 
gacgttttta atgtactggg gtggtttttc 
tgcccttcac cgcctggccc tgagagagtt 
gcaggcgaaa atcctgtttg atggtggttc 
agaatagccc gagatagggt tgagtgttgt 
gaacgtggac tccaacgtca aagggcgaaa 
tgaaccatca cccaaatcaa gttttttggg 
ccctaaaggg agcccccgat ttagagcttg 
ggaagggaag aaagcgaaag gagcgggcgc 
gatcggtgcg ggcctcttcg ctattacgcc 
gattaagttg ggtaacgcca gggttttccc 
aattaattcc catcttgaaa gaaatatagt 
ggtattatag tccaagcaaa aacataaatt 
tcaataactg attatatcag ctggtacatt 
tgtgtaatac ataaattgat gatatagcta 
agcttgggtc ccgctcagaa gaactcgtca 
tcgggagcgg cgataccgta aagcacgagg 
tcagcaatat cacgggtagc caacgctatg 
ccacagtcga tgaatccaga aaagcggcca 
tcgccatggg tcacgacgag atcctcgccg 
agttcggctg gcgcgagccc ctgatgctct 
gcttccatcc gagtacgtgc tcgctcgatg 
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taaagaaata 


gcgccactca 


gcttcctcag 


8100 


ggcatagttc 


tcaagatcga 


cagcctgtca 


8160 


ataattcgga 


tctctgcgag 


ggagatgata 


8220 


gttacaatca 


acatgctacG 


ctccgcgaga 


8280 


tgccgttctt 


ccgaatagca 


tcggtaacat 


8340 


cccgctgacg 


ccgtcccgga 


ctgatgggct 


8400 


ctgccggtcg 


gggagctgtt 


ggctggctgg 


8460 


gacgcttaga 


caacttaata 


acacattgcg 


8520 


ttttcaccag 


tgagacgggc 


aacagctgat 


8580 


gcagcaagcg 


gtccacgctg 


gtttgcccca 


8640 


cgaaatcggc 


aaaatccctt 


ataaatcaaa 


8700 


tccagtttgg 


aacaagagtc 


cactattaaa 


8760 


aaccgtctat 


cagggcgatg 


gcccactacg 


8820 


gtcgaggtgc 


cgtaaagcac 


taaatcggaa 


8880 


acggggaaag 


ccggcgaacg 


tggcgagaaa 


8940 


cattcaggct 


gcgcaactgt 


tgggaagggc 


9000 


agctggcgaa 


agggggatgt 


gctgcaaggc 


9060 


agtcacgacg 


ttgtaaaacg 


acggccagtg 


9120 


ttaaatattt 


attgataaaa 


taacaagtca 


9180 


tattgatgca 


agtttaaatt 


cagaaatatt 


.9240 


gccgtagatg 


aaagactgag 


tgcgatatta 


9300 


gcttagctca 


tcgggggatc 


cgtcgaagct 


9360 


agaaggcgat 


agaaggcgat 


gcgctgcgaa 


9420 


aagcggtcag 


cccattcgcc 


gccaagctct 


9480 


tcctgatagc 


ggtccgccac 


acccagccgg 


9540 


ttttccacca 


tgatattcgg 


caagcaggca 


9600 


tcgggcatgc 


gcgccttgag 


cctggcgaac 


9660 


tcgtccagat 


catcctgatc 


gacaagaccg 


9720 


cgatgtttcg 


cttggtggtc 


gaatgggcag 


9780 



gtagccggat 


caagcgtatg 


cagccgccgc 


gcaggagcaa 


ggtgagatga 


caggagatcc 


tcccttcccg 


cttcagtgac 


aacgtcgagc 


agccacgata 


gccgcgctgc 


ctcgtcctgc 


ttgacaaaaa 


gaaccgggcg 


cccctgcgct 


ccgattgtct 


gttgtgccca 


gtcatagccg 


cctgcgtgca 


atccatcttg 


ttcaatccaa 


tctggattga 


gagtgaatat 


gagactctaa 


agtggagcat 


ttttgacaag 


aaatatttgc 


acgcgcaata 


atggtttctg 


acgtatgtgc 


tgagtggctc 


cttcaacgtt 


gcggttctgt 


gtcatcggcg 


ggggtcataa 


cgtgactccc 


gcgccatcag 


atccttggcg 


gcaagaaagc 


cttaccagag 


ggcgccccag 


ctggcaattc 


gtctagctat 


cgccatgtaa 


gcccactgca 


ttcccttgtc 


cagatagccc 


agtagctgac 


actggctttc 


tacgtgttcc 


gcttccttta 


gcgtgaagct 


tgcatgcctg 


caggtcgacg 


attgccacta 


aacgtctaaa 


cccttgtaat 


tttgatttgc 


gataaatttt 


tatatttggt 


tttgccaaca 


cttagcaatt 


tgcaagttga 


aaatacatat 


actaatcaac 


tggaaatgta 


attaaagtga 


gtgaatatgg 


taccacaagg 


ggatggcata 


tacaccaaac 


attcaataat 


tttgaggtgc 


atgaacgtca 


cgtggacaaa 


taccacacac 


aagt 1 1 1 gag 


gtgcatgcat 


tggaaatgat 


ttgcatggaa 


gccatgtgta 


aatgaagaaa 


actacaaatt 


tacatgcaac 


ttttgcaata 


ctttcattca 


tacacactca 
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attgcatcag 


ccatgatgga 


tactttctcg 


9840 


tgccccggca 


cttcgcccaa 


tagcagccag 


9900 


acagctgcgc 


aaggaacgcc 


cgtcgtggcc 


9960 


agttcattca 


gggcaccgga 


caggtcggtc 


10020 


gacagccgga 


acacggcggc 


atcagagcag 


10080 


aatagcctct 


ccacccaagc 


ggccggagaa 


10140 


gctcccatgg 


gccctcgact 


agagtcgaga 


10200 


ttggataccg 


aggggaattt 


atggaacgtc 


10260 


tagctgatag 


tgaccttagg 


cgacttttga 


10320 


ttagctcatt 


aaactccaga 


aacccgcggc 


10380 


cagttccaaa 


cgtaaaacgg 


cttgtcccgc 


10440 


ttaattctcc 


gctcatgatc 


ttgatcccct 


10500 


catccagttt 


actttgcagg 


gcttcccaac 


10560 


cggttcgctt 


gctgtccata 


aaaccgccca 


10620 


agctacctgc 


tttctctttg 


cgcttgcgtt 


10680 


attcatccgg 


ggtcagcacc 


gtttctgcgg 


10740 


gcagcccttg 


cgccctgagt 


gcttgcggca 


10800 


gcgcgccgag 


ctcctcgagc 


aaatttacac 


10860 


ttgtttttgt 


tttac.tatgfc 


gtgttatgta 


10920 


actaaattta 


taacaccttt 


tatgctaacg 


10980 


ttaattgatt 


ctaaattatt 


tttgtcttct 


11040 


aatatttgct 


aatatttcta 


ctataggaga 


11100 


tttggagatt 


taattgttgc 


aatgctgcat 


11160 


tcttgaggat 


aataatggta 


ccacacaaga 


11220 


aggtttagta 


atttttcaag 


acaacaatgt 


11280 


ggatgccctg 


tggaaagttt 


aaaaatattt 


11340- 


aaaccatgac 


atccacttgg 


aggatgcaat 


11400 


tagttatgca 


tgtagtctat 


ataatgagga 


11460 


ctaagtttta 


cacgattata 


atttcttcat 


11520 
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agccagccca ccgcggtgga aa atg gag gtc gtg gag aga ttc tac ggt gag 11572 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu 
15 10 

ttg gat ggg aag gtc teg cag ggc gtg aat gca ttg ctg ggt agt ttt 11620 
Leu Asp Gly Lys Val Ser Gin Gly Val Asn Ala Leu Leu Gly Ser Phe 

15 20 25 

ggg gtg gag ttg acg gat acg ccc act acc aaa ggc ttg ccc etc gtt . 11668 
Gly Val Glu Leu Tlir Asp Tlir Pro Tlir Thr Lys Gly Leu , Pro Leu Val 
30 ■ 35 40 

gac agt ccc aca ccc ate gtc etc ggt gtt tct gta tac ttg act att 11716 
Asp Ser Pro Thr. Pro lie Val Leu Gly Val Ser Val Tyr Leu Thr lie 
45 50 55 

gtc att gga ggg ctt ttg tgg ata aag gcc agg gat ctg aaa ccg cgc 11764 
Val lie Gly Gly Leu Leu Trp lie Lys Ala Arg Asp Leu Lys Pro Arg 
60 65 70 

gcc teg gag eca ttt ttg etc caa get ttg gtg ctt gtg cae aac ctg , 11812 
Ala Ser Glu Pro Phe Leu Leu Gin Ala Leu Val Leu Val His Asn Leu 
75 ■ 80 85 90 

ttc tgt ttt gcg etc agt ctg tat atg tge gtg ggc ate get tat cag' 11860 
Phe Cys Phe Ala Leu Ser Leu Tyr Met Cys Val Gly lie Ala Tyr Gin 

95 100 105 

get att acc tgg egg tac tct etc tgg ggc aat gca tac aat cet aaa 11908 
Ala lie Thr Trp Arg Tyr Ser Leu Trp. Gly Asn Ala Tyr Asn Pro Lys 
110 115 120 

eat aaa gag atg gcg att ctg gta tac ttg ttc tac atg tct aag tac 11956 
His Lys Glu Met Ala lie Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr 

125 ' 130 135 1. . I 

gtg gaa ttc atg gat acc gtt ate atg ata ctg aag cgc age acc agg 12004 
Val Glu Phe Met Asp Thr Val lie Met lie Leu Lys Arg Ser Thr Arg 
140 145 150 

caa ata age ttc etc cae gtt tat eat eat tct tea att tee etc att 12052 
Gin lie Ser Phe Leu His Val Tyr His His Ser Ser lie Ser Leu lie 

155 160 165 170 

tgg tgg get att get cat cae get cet ggc ggt gaa gca tat tgg tct 12100 
Trp Trp Ala lie Ala His His Ala Pro Gly Gly Glu Ala Tyr Tirp Ser 
175 180 185 

gcg get ctg aac tea gga gtg eat gtt etc atg tat gcg tat tac ttc 12148 
Ala Ala Leu Asn Ser Gly Val His Val Leu Met Tyr Ala Tyr Tyr Phe 
190 195 200 

ttg get gee tge ctt cga agt age cca aag tta aaa aat aag tac ctt 1219 6 
Leu Ala Ala Cys Leu Arg Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu- 
205 210 215 



ttt tgg ggc agg tac ttg aca caa ttc caa atg ttc cag ttt atg ctg 
Phe Trp Gly Arg Tyr Leu Thr Gin Phe Gin Met Phe Gin Phe Met Leu 



12244 
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220 225 230 

aac tta gtg cag get tac tac gac atg aaa acg aat gcg cca tat cca 
Asn Leu Val Gin Ala Tyr Tyr Asp Met hys Thr Asn Ala Pro Tyr Pro 
235 240 245 250 

caa tgg ctg ate aag att ttg ttc tac tac atg ate teg ttg etg ttt 
Gin Trp Leu He Lys He Leu Phe Tyr Tyr Met He Ser Leu Leu Phe 
255 260 265 

ctt ttc ggc aat ttt tac gta caa aaa tac ate aaa ccc tct gac gga 
Leu Phe Gly Asn Phe Tyr Val Gin Lys Tyr He Lys Pro Ser Asp Gly 

270 ' 275 , ~ , 280 



12292 



12340 



12388 



aag caa aag gga get aaa act gag tga tctagaaggc ctcctgcttt 12435 
Lys Gin Lys Gly Ala Lys Thr Glu 
285 290 

aatgagatat gcgagacgcc tatgategea tgatatttgc tttcaattet gttgtgcacg 12495 

• ttgtaaaaaa ectgagcatg tgtagctcag atcettaccg - ecggtttcgg tteattctaa 12555 

tgaatatatc acecgttact atcgtatttt tatgaataat attctccgtt eaatttactg 12 615 

attgtccgtc gagcaaattt acacattgce actaaaegtc taaaecettg taatttgttt 12675 

ttgttttact atgtgtgtta tgtatttgat ttgegataaa tttttatatt tggtactaaa 12735 

" tttataacac cttttatgct aaegtttgcc aacaettagc aatttgcaag ttgattaatt 12795 

gattctaaat tatttttgte ttctaaatae atatactaat caactggaaa tgtaaatatt 12855 

tgctaatatt tctactatag gagaattaaa gtgagtgaat atggtaecac aaggtttgga 12915 

gatttaattg ttgcaatge't gcatggatgg eatatacace aaacattcaa taattcttga 12975 

ggataataat ggtaccacac aagatttgag gtgcatgaac gtcaegtgga eaaaaggttt 13 03 5 

agtaattttt caagacaaca atgttaccac acacaagttt tgaggtgcat gcatggatgc 13095 

cctgtggaaa gtttaaaaat attttggaaa tgatttgeat ggaagccatg tgtaaaacca 13155 

tgaeatccac ttggaggatg caataatgaa gaaaactaca aatttaeatg caactagtta 13215 

tgcatgtagt ctatataatg aggattttgc aataetttea tteatacaca cteactaagt 13275 

tttacacgat tataatttet tcatagccag eggatec atg gta ttc gcg ggc ggt 13330 

Met Val Phe Ala Gly Gly 
295 

gga ctt cag cag ggc tct etc gaa gaa aac ate gac gte gag cac att 13378 
Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn He Asp Val Glu His He 
300 305 310 



gee agt atg tct etc ttc age gac ttc ttc agt tat gtg tct tea act 
Ala Ser Met Ser Leu Phe Ser Asp Phe Phe Ser Tyr Val Ser Ser Thr 
315 320 325 



13426 
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gtt ggt teg tgg age gta cac agt ata caa cct ttg aag cgc ctg acg 
Val Gly Ser Trp Ser Val His Ser lie Gin Pro Leu Lys Arg Leu Thr 
330 335 340 345 

agt aag aag cgt gtt teg gaa age get gee gtg eaa tgt ata tea get 
Ser Lys Lys Arg Val Ser Glu Ser Ala Ala Val Gin Cys lie Ser Ala 
350 355 360 

gaa gtt cag aga aat teg agt acc cag gga aet geg gag gca etc gca 
Glu Val Gin Arg Asn Ser Ser Thr Gin Gly Thr Ala Glu Ala Leu Ala 
365 370 375 

gaa tea gte gtg aag cee acg aga ega agg tea tet cag tgg aag aag 
Glu Ser Val Val Lys Pro Thr Arg Arg Arg Ser Ser Gin Trp Lys Lys 
380 385 . * 390 

teg aea cac ccc eta tea gaa gta gea gta cac aac aag eca age gat 
Ser Thr His Pro Leu Ser Glu Val Ala Val His Asn Lys Pro Ser Asp 
395 400 405 

tgc tgg att gtt gta aaa aac aag gtg tat gat gtt tec aat ttt geg 
Cys Trp lie Val Val Lys Asn Lys Val Tyr Asp Val Ser Asn Phe Ala 
410- 415 420 425 

gac gag cat ccc gga gga tea gtt att agt aet tat ttt gga cga gac 
Asp Glu His Pro Gly Gly Ser Val lie Ser Thr Tyr Phe Gly Arg Asp 
430 435 440 

ggc aca gat gtt ttc tet agt ttt cat gca get tet aea tgg aaa att 
Gly Thr Asp Val Phe Ser Ser Phe His Ala Ala Ser Thr Trp Lys lie 
445 450 _ . 455 

• ' ', 

dtt caa gac ttt tac att ggt gac gtg gag agg gtg gag ccg act eca 
Leu Gin Asp Phe Tyr lie Gly Asp Val Glu Arg Val Glu Pro Thr Pro 
460 465 470 

gag etg ctg aaa gat ttc cga gaa atg aga get ctt ttc ctg agg gag 
Glu Leu Leu Lys Asp Phe Arg Glu Met Arg Ala Leu Phe Leu Arg Glu 
475 480 485 

caa ctt ttc aaa agt teg aaa ttg tac tat gtt atg aag ctg etc acg 
Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr Val Met Lys Leu Leu Thr 
490 495 500 505 

aat gtt get att ttt get geg age att gca ata ata tgt tgg age aag 
Asn Val Ala He Phe Ala Ala Ser He Ala He He Cys Trp Ser Lys 
510 515 520 

act att tea geg gtt ttg get tea get tgt atg atg get ctg tgt ttc 
Thr He Ser Ala Val Leu Ala Ser Ala Cys Met Met Ala Leu Cys Phe 
525 530 535 

caa cag tgc gga tgg eta tee eat gat ttt etc cac aat cag gtg ttt 
Gin Gin Cys Gly Trp Leu Ser His Asp Phe Leu His Asn Gin Val Phe 
540 545 550 



gag aca cgc tgg ctt aat gaa gtt gtc ggg tat gtg ate ggc aac gee 
Glu Thr Arg Trp Leu Asn Glu Val Val Gly Tyr Val He Gly Asn Ala 
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555 560 565- 

gtt ctg ggg ttt agt aca ggg tgg tgg aag gag aag cat aac ctt cat 14194 
Val Leu Gly Piie Ser Thr Gly Trp Tarp Lys Glu Lys His Asn Leu His 
570 575 580 585 

cat get get cca aat gaa tgc gat cag act tac caa cca att gat gaa 14242 
His Ala Ala Pro Asn Glu Cys Asp Gin Thr Tyr Gin Pro lie Asp Glu 
590 595 600 

gat att gat act etc ccc etc att gee tgg age aag gac ata ctg gee 14290 
Asp He Asp Thr Leu Pro Leu He Ala Trp Ser Lys Asp He Leu Ala 
605 610 615 

aca gtt gag aat aag aca ttc ttg ega ate etc caa tac cag cat ctg 1433 8 
Thr Val Glu Asn Lys Thr Phe Leu Arg He Leu Gin Tyr Gin His Leu 
620 625 630 

ttc ttc atg ggt ctg tta ttt ttc gee egt ggt agt tgg etc ttt tgg 14386 
Phe Phe Met Gly Leu Leu Phe Phe Ala Arg Gly Ser Trp Leu Phe Trp 
635 640 645 

age tgg aga tat ace tet aca gea gtg etc tea ect gte gac agg ttg 14434 
Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu Ser Pro Val Asp Arg Leu 
650 655 660 665 

ttg gag aag gga act gtt ctg ttt cae tac ttt tgg ttc gte ggg aca 14482 
Leu Glu Lys Gly Thr Val Leu Phe His Tyr Phe Trp Phe Val Gly Thr 
670 675 680 

gcg tgc tat ctt etc ect ggt tgg aag cca tta gta tgg atg gcg gtg 1453 0 
Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro Leu Val Trp Met Ala Val 
685 690 695 

act gag etc atg tec ggc atg ctg ctg ggc ttt gta ttt gta ctt age 14578 
Thr Glu Leu Met Ser Gly Met Leu Leu Gly Phe Val Phe Val Leu Ser 
•700 705 710 

cae aat ggg atg gag gtt tafc aat teg tet aaa gaa ttc gtg agt gea -.14626 
His Asn Gly Met Glu Val Tyr Asn Ser Ser Lys Glu Phe Val Ser Ala 
715 720 725 

cag ate gta tec aca egg gat ate aaa gga aac ata ttc aac gac tgg 14674 
Gin He Val Ser Thr- Arg Asp He Lys Gly Asn He Phe Asn Asp Trp 
730 735 740 745 

ttc act ggt ggc ctt aac agg caa ata gag cat cat ctt ttc cca aca 14722 
Phe Thr Gly Gly Leu Asn Arg Gin He Glu His His Leu Phe Pro Thr 
750 755 760 

atg ccc agg cat aat tta aac aaa ata gea ect aga gtg gag gtg ttc 14770 
Met Pro Arg His Asn Leu Asn Lys He Ala Pro Arg Val Glu Val Phe 
765 770 775 

tgt aag aaa cac ggt ctg gtg tac gaa gac gta tet att get ace ggc 14818 
Cys Lys Lys His Gly Leu Val Tyr Glu Asp Val Ser He Ala Thr Gly 
780 785 • 790 
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act tgc aag gtt ttg aaa gca ttg aag gaa gtc gcg gag get gcg gca 14866 
Tlir Cys Lys Val Leu Lys Ala Leu Lys Glu Val Ala Glu Ala Ala Ala . 
795 800 805 

gag cag cat get acc acc agt taa gctagcgtta accctgcttt aatgagatat 14920 
Glu Gin His Ala Thr Thr Ser 
810 815 



gcgagacgcc 


tatgatcgca 


tgatatttgc 


tttcaattct 


gttgtgcacg 


ttgtaaaaaa 


14980 


cctgagcatg 


. tgtagctcag 


atqcttaccg 


ccggtttcgg 


ttcattctaa 


tgaatatatc 


15040 


acccgttact 


atcgtatttt 


tatgaataat 


attctccgtt 


caatttactg 


attgtccgtc 


15100 


gagcaaattt 


acacattgcc 


actaaacgtc 


taaacccttg 


taatttgttt 


ttgttttact 


15160 


atgtgtgtta 


tgtatttgat 


ttgcgataaa 


tttttatatt 


tggtactaaa 


tttataacac 


15220 


cttttatgct 


aacgtttgcc 


aacacttagc 


aatttgcaag 


ttgattaatt 


gattctaaat 


15280 


tatttttgtc 


ttctaaatac 


atatactaat 


caactggaaa 


tgtaaatatt 


tgctaatatt 


15340 


tctactatag 


gagaattaaa 


gtgagtgaat 


atggtaccac 


aaggtttgga 


gatttaattg 


15400 


ttgcaatgct 


gcatggatgg 


catatacacc 


aaacattcaa 


taattcttga 


ggataataat 


15460 


ggtaccacac 


aagatttgag 


gtgcatgaac 


gtcacgtgga 


caaaaggttt 


agtaattttt 


15520 


caagacaaca 


atgttaccac 


acacaagttt 


tgaggtgcat 


gcatggatgc 


cctgtggaaa 


15580 


gtttaaaaat 


attttggaaa 


tgatttgcat 


ggaagccatg 


tgtaaaacca 


tgacatccac 


15640 


ttggaggatg 


caataatgaa 


gaaaactaca 


aatttacatg 


caactagtta 


. tgcatgtagt 


15700 


ctatataatg 


aggattttgc . 


aatactttca 


ttcatacaca 


ctcactaagt 


tttacacgat 


15760 


tataatttct 


tcatagccag 


cagatctaaa 


atg get ccg gat gcg gat aag ctt 
Met Ala Pro Asp Ala Asp Lys Leu 


15814 



820 825 

cga caa cgc cag acg act gcg gta gcg aag cac aat get get acc ata 15862 
Arg Gin Arg Gin Thr Thr Ala Val Ala Lys His Asn Ala Ala Thr He 
830 835 840 

teg acg cag gaa cgc ctt tgc agt ctg tct teg etc aaa ggc gaa gaa 15910 
Ser Thr Gin Glu Arg Leu Cys Ser Leu Ser Ser Leu Lys 'Gly Glu Glu 
845 850 855 

gtc tgc ate gac gga ate ate tat gac etc caa tea tte gat cat ccc 15958 
Val Cys He Asp Gly He He Tyr Asp Leu Gin Ser Phe Asp His Pro 
860 865 ' 870 

ggg ggt gaa acg ate aaa atg ttt ggt ggc aac gat gtc act gta cag 16006 
Gly Gly Glu Thr He Lys Met Phe Gly Gly Asn Asp Val Thr Val Gin 
875 880 885 



tac 
Tyr 



aag atg att cac ccg tac cat acc gag aag cat ttg gaa 
Lys Met He His Pro Tyr His Thr Glu Lys His Leu Glu 



aag atg 
Lys Met 



16054 
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890 



895 



900 



905 



aag cgt gtc ggc aag gtg acg gat ttc gtc tgc gag tac aag ttc gat 
Lys Arg Val Gly Lys Val Thr Asp Phe Val Cys Glu Tyr Lys Phe Asp 
910 915 920 



16102 



acc gaa ttt gaa cgc gaa ate aaa cga gaa gtc ttc aag att gtg cga 
Thr Glu Pile Glu Arg Glu lie Lys Arg Glu Val Phe Lys lie Val Arg 
. 925 930 935 



16150 



cga ggc aag gat ttc ggt act ttg gga tgg ttc ttc cgt gcg ttt tgc 
Arg Gly Lys Asp Phe Gly Thr Leu Gly Trp Phe Phe Arg Ala Phe Cys 
940 945 950 



16198 



tac att gcc att ttc ttc tac ctg cag tac cat tgg gtc acc acg gga 
Tyr lie Ala lie Phe Phe Tyr Leu Gin Tyr His Trp Val Thr Thr Gly 
955 960 965 



16246 



acc tct tgg ctg ctg gcc gtg gcc tac gga ate tec caa gcg atg att 
Thr Ser T3rp Leu Leu Ala Val Ala Tyr Gly lie Ser Gin Ala Met lie 
970 975 980 985 



16294 



ggc atg aat gtc cag cac .gat gcc aac ~cac ggg gcc acc tec aag cgt 
Gly Met Asn Val Gin His Asp Ala Asn His Gly Ala Thr Ser Lys Arg 
990 995 1000 



16342 



ecc tgg gtc aac gac atg eta ggc etc ggt gcg gat ttt att ggt ggt 
Pro Trp Val Asn Asp Met Leu Gly Leu Gly Ala Asp Phe lie Gly Gly 
1005 1010 1015 ' 



16390 



tec aag tgg etc tgg cag gaa caa cac tgg acc cac cac- get tac ace 
Ser Lys Trp Leu Trp Gin Glu Gin His Trp Thr His His Ala Tyr Thr 
1020 1025 - 1030 



16438 



aat cac gcc gag atg gat ecc gat age ttt ggt gee gaa cea atg etc 
Asn His Ala Glu Met Asp Pro Asp Ser Phe Gly Ala Glu Pro Met Leu 
1035 1040 1045 



16486 



eta ttc aac gac tat ecc ttg gat eat ecc get cgt ace tgg eta cat 
Leu Phe Asn Asp Tyr Pro Leu Asp His Pro Ala Arg Thr Trp Leu His 
1050 1055 1060 1065 



16534 



cgc ttt caa gca ttc ttt tac atg ecc gtc ttg get gga tac tgg ttg 
Arg Phe Gin Ala Phe . Phe Tyr Met Pro Val Leu Ala Gly Tyr Trp Leu 
1070 1075 1080 



16582 



tee get gtc ttc aat cea caa att ett gac etc cag caa cgc ggc gca 
Ser Ala Val Phe Asn Pro Gin lie Leu Asp Leu Gin Gin Arg Gly Ala 
1085 1090 1095 



16630 



ett tec gtc ggt ate cgt etc gac aac get ttc att cac teg cga cgc 
Leu Ser Val Gly lie Arg Leu Asp Asn Ala Phe He His Ser Arg Arg 
1100 1105 ■ 1110 



16678 



aag tat gcg gtt ttc tgg egg get gtg tac att gcg gtg aac gtg att 
Lys Tyr Ala Val Phe Trp Arg Ala Val Tyr He Ala Val Asn Val He 
1115 1120 1125 



16726 



104 

get Gcg ttt tac aca aac tec ggc etc gaa tgg tcctgg cgt gtc ttt 16774 
Ala Pro Phe Tyr Tiir Asn Ser Gly Leu Glu Trp Ser Trp Arg Val Phe 
1130 1135 1140 1145 

gga aac ate atg etc atg ggt gtg geg gaa teg etc gcg ctg gcg gtc 16822 
Gly Asn He Met Leu Met Gly Val Ala Glu Ser Leu Ala Leu Ala Val 
1150 1155 1160 



etg ttt teg ttg teg cae aat ttc gaa tec geg gat cgc gat eeg ace 
Leu Pile Ser Leu Ser His Asn Plie Glu Ser Ala Asp Arg Asp Pro Thr 
1165 1170 • 1175 



16870 



gee cca ctg aaa aag acg gga gaa cea gtc gac tgg ttc aag aca cag 
Ala Pro Leu Lys Lys Thr Gly Glu Pro Val Asp Trp Phe Lys Thr Gin 
1180 1185 1190 



16918 



gtc gaa act tec tgc act tac ggt gga ttc ett tec ggt tge ttc acg 
Val Glu Thr Ser Cys Thr Tyr Gly Gly Phe Leu Ser Gly Cys Phe Thr 
1195 1200 1205 



16966- 



gga ggt etc aac ttt cag gtt gaa cae cac ttg ttc cca cgc atg age 17014 
Gly Gly Leu Asii Phe Gin Val Glu His His Leu Phe Pro Arg Met Ser 
1210 1215 1220 1225 

age get tgg tat ccc tac att gee ccc aag gtc cgc gaa att tgc gee 17062 
Ser Ala Trp Tyr Pro Tyr He Ala Pro Lys Val Arg Glu He Cys Ala 
1230 1235 1240 



aaa cac ggc gtc cac tac gcc tac tac ccg tgg ate cac caa aac ttt 
Lys His Gly Val His Tyr Ala Tyr Tyr Pro Trp He His Gin Asn Phe 
1245 1250 1255 



17110 



etc tec acc gtc cgc tac atg cac gcg gcc ggg ace ggt gee aac tgg 
Leu Ser Thr Val Arg Tyr Met His Ala Ala Gly Thr Gly Ala Asn Trp 
1260 ' 1265 1270 



17158 



cgc cag atg gcc aga gaa aat ccc ttg acc gga egg gcg taa 
Arg Gin Met Ala Arg Glu Asn Pro Leu Thr Gly Arg Ala 
1275 1280 1285 



17200 



agatctgecg 


gcatcgatec 


cgggccatgg 


cetgetttaa 


tgagatatgc 


gagacgccta 


17-260 


tgatcgcatg 


atatttgett 


teaattctgt 


tgtgcacgtt 


gtaaaaaace 


tgagcatgtg 


17320 


tagctcagat 


ccttaccgcc 


ggtttcggtt 


cattctaatg 


aatatatcac 


ccgttactat 


17380 


cgtattttta 


tgaataatat 


tctcegttca 


atttactgat 


tgtccgtcga 


cgagctcgge 


17440 


gegectctag 


aggatcgatg 


aattcagate 


ggctgagtgg 


etccttcaac 


gttgcggttc 


17500 


tgtcagttec 


aaacgtaaaa 


eggcttgtec 


cgegtcateg 


gcgggggtea 


taacgtgact 


17560 


eccttaatte 


teegctcatg 


ateagattgt 


cgtttcccgc 


ettcagttta 


aactatcagt 


17620 


gtttgacagg 


at at att ggc 


gggtaaaect 


aagagaaaag 


agcgtttatt 


agaataatcg 


17680 


gatatttaaa 


agggcgtgaa 


aaggtttatc 


ettcgtceat 


ttgtatgtgc 


atgecaacca 


17740 



cagggttccc ca 



105 



17752 



<210> 29 
<211> 290 
<212> PRT 
<213> Unknown 



<400> 29 

Met Glu Val Val Glu Arg Phe Tyr Gly Glu Leu Asp Gly Lys Val Ser 
1 5 10 • . 15 

Gin Gly Val Asn Ala Leu Leu Gly Ser Phe Gly Val Glu Leu Thr Asp 
20 25 30 

Tiir Pro Th.r Tiir Lys Gly Leu Pro Leu Val Asp Ser Pro Thr Pro lie 
35 40 45 - 

Val Leu Gly Val Ser Val Tyr Leu Thr lie Val He Gly Gly Leu Leu 
50 55 60 • 

Trp He Lys Ala Arg Asp Leu Lys Pro Arg Ala Ser Glu Pro Phe Leu 
65 70 - 75 . 80 

Leu Gin Ala Leu .Val Leu Val His Asn Leu Phe Cys Phe Ala Leu Ser 

85 90. 95 

Leu Tyr Met Cys Val Gly He Ala Tyr Gin Ala He Thr Trp Arg Tyr 
100 105 110 

Ser Leu Trp Gly Asn Ala Tyr Asn Pro Lys His Lys Glu Met Ala He 
115 120 125 

Leu Val Tyr Leu Phe Tyr Met Ser Lys Tyr Val Glu Phe Met Asp Thr 
130 135 140 

Val He Met He Leu Lys Arg Ser Thr Arg Gin He Ser Phe Leu His 
145 150 155 160 

Val Tyr His His Ser Ser He Ser Leu He Trp Trp Ala , He Ala His 
165 170 175 

His Ala Pro Gly Gly Glu Ala Tyr Trp Ser Ala Ala Leu Asn Ser Gly 
180 185 190 

Val His Val Leu Met Tyr Ala Tyr Tyr Phe Leu Ala Ala Cys Leu Arg 
195 200 205 

Ser Ser Pro Lys Leu Lys Asn Lys Tyr Leu Phe Trp Gly Arg Tyr Leu 
210 215 220 



Thr Gin Phe Gin Met Phe Gin Phe Met Leu Asn Leu Val Gin Ala Tyr 
225 230 235 240 

Tyr Asp Met Lys Thr Asn Ala Pro Tyr Pro Gin Trp Leu He Lys He 
245 250 255 



Leu Phe Tyr Tyr Met He Ser Leu Leu Phe Leu Phe Gly Asn Phe Tyr 
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260 265 270 

Val Gin Lys Tyr He Lys Pro Ser Asp Gly Lys Gin Lys Gly Ala Lys 
275 280 285 

Tlir Glu 
290 



<210> 30 
<211> 525 
<212> PRT 
<213> Un3<nown 

<400> 30 

Met Val Pixe Ala Gly Gly Gly Leu Gin Gin Gly Ser Leu Glu Glu Asn 
1 5 . . 10 15 

He Asp Val Glu His He Ala Ser Met Ser Leu Phe Ser Asp Plie Plie. 
'20 25' 30 

Ser Tyr Val Ser Ser Tlir Val Gly Ser Trp Ser Val His Ser He Gin 

35 .40 45 , 

Pro Leu Lys Arg Leu Thr Ser Lys Lys Arg Val Ser Glu Ser Ala Ala 
50 55 60 

Val Gin Cys He Ser Ala Glu Val Gin Arg Asn Ser Ser Thr Gin Gly 

65 .70 75 i > 80 

Thr Ala Glu Ala Leu Ala* Glu Ser Val Val Lys Pro Thr Arg Arg Arg 

85 90 I 95 

Ser Ser Gin Trp Lys Lys Ser Thr His Pro Leu Ser Glu Val Ala Val 
100 • 105 110 

His Asn Lys Pro Ser Asp Cys Trp He Val Val Lys Asn Lys Val Tyr 
115 . 120 125 

Asp Val Ser Asn Phe Ala Asp Glu His Pro Gly Gly Ser Val He Ser 
130 135 140 

Thr Tyr Phe Gly Arg Asp Gly Thr Asp Val Phe Ser Ser Phe His Ala 
145 150 155 160 

Ala Ser Thr Trp Lys He Leu Gin Asp Phe Tyr He Gly Asp Val Glu 
165 170 175 

Arg Val Glu Pro Thr Pro Glu Leu Leu Lys Asp Phe Arg Glu Met Arg 
180 ■ 185 190 

Ala Leu Phe Leu Arg Glu Gin Leu Phe Lys Ser Ser Lys Leu Tyr Tyr 
-195 200 205 - 

Val Met Lys Leu Leu Thr Asn Val Ala He Phe Ala Ala Ser He Ala 
210 215 220 



He He Cys Trp Ser Lys Thr He Ser Ala Val Leu Ala Ser Ala Cys 
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225 230 235 240 

Met Met Ala Leu Cys Plie Gin Gin Cys Gly Trp Leu Ser His Asp Phe 
245 250 255 

Leu His Asn Gin Val Phe Glu Thr Arg Trp Leu Asn Glu Val Val Gly 
260 265 270 

Tyr Val lie Gly Asn Ala Val Leu Gly Phe Ser Thr Gly Trp Trp Lys 

275 280 285 

Glu Lys His Asn Leu His His Ala Ala Pro Asn Glu Cys Asp Gin Thr 
290 295 300 

Tyr Gin Pro lie Asp Glu Asp lie Asp Thr Leu .Pro Leu lie Ala Trp 
305 310 315 320 

. Ser Lys Asp He Leu Ala Thr Val Glu Asn Lys Thr Phe Leu' Arg He 

325 33.0 335 

Leu Gin Tyr Gin His Leu Phe Phe Met Gly Leu Leu Phe Phe Ala Arg 
340 345 350 

Gly Ser Trp Leu Phe Trp Ser Trp Arg Tyr Thr Ser Thr Ala Val Leu 
355 360 365 

Ser Pro Val Asp Arg Leu Leu Glu Lys Gly Thr Val Leu Phe His Tyr 
370 375 380 

Phe Trp Phe Val Gly Thr Ala Cys Tyr Leu Leu Pro Gly Trp Lys Pro 
385 390 395 400 

Leu Val Trp Met Ala Val Thr Glu Leu Met Ser Gly Met Leu Leu Gly 
405 410 415 

Phe Val Phe Val Leu Ser His Asn Gly Met Glu Val Tyr Asn Ser Ser 
420 425 430 

Lys Glu Phe Val Ser Ala Gin He Val, Ser Thr Arg Asp He Lys Gly 

435 440 445 

Asn He Phe Asn Asp Trp Phe Thr Gly Gly Leu Asn Arg Gin He Glu 
450 455. 460 

His His Leu Phe Pro Thr Met Pro Arg His Asn Leu Asn Lys He Ala 
465 470 475 480 

Pro Arg Val Glu Val Phe Cys Lys Lys His Gly Leu Val Tyr Glu Asp 
485 490 495 

Val Ser He Ala Thr Gly Thr Cys Lys Val Leu Lys Ala Leu Lys Glu 
500 505 510 

Val Ala Glu Ala Ala Ala Glu Gin His Ala Thr Thr Ser 
515 520 525 



<210> 31 
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<211> 469 
<212> PRT 
<213> Unknown 

<400> 31 

Met Ala Pro Asp Ala Asp Lys Leu Arg Gin Arg Gin Thr Thr Ala t^al 
15 10 15 

Ala Lys His Asn Ala Ala Thr He Ser Thr Gin Glu Arg Leu Cys Ser 
20 25 30 

Leu Ser Ser Leu Lys Gly Glu Glu Val Cys He Asp Gly He He Tyr 
35 '40 45 ' . 

Asp Leu Gin Ser Phe Asp His Pro Gly Gly Glu Thr He Lys Met Phe 
50 55 60 

Gly Gly Asn Asp Val Thr Val Gin Tyr Lys Met He His Pro Tyr His 
.65 70 75 80 

Thr Glu Lys His Leu Glu Lys Met Lys Arg Val Gly Lys Val ' Thr Asp 

85 90 95 

Phe Val Cys Glu Tyr Lys Phe Asp Thr Glu Phe Glu Arg Glu He Lys 
100 105 110 

Arg Glu Val Phe Lys He Val Arg Arg Gly Lys Asp Phe Gly Thr Leu 
115 120 125 

Gly Trp Phe Phe Arg Ala Phe Cys Tyr He Ala He Phe Phe Tyr Leu 
130 135 ' 140 

Glii Tyr His Tarp Val Thr Thr Gly Thr Ser Trp Leu Leu Ala Val Ala 
145 150 155 160 

Tyr Gly He Ser Gin Ala Met He Gly Met Asn Val Gin His Asp Ala 
165 170 175 

Asn His Gly Ala Thr Ser Lys Arg Pro Trp Val Asn Asp Met Leu Gly 
180 185 190 

Leu Gly Ala Asp Phe He Gly Gly Ser Lys Trp Leu Trp Gin Glu Gin 
195 200 205 

His Trp Thr His His Ala Tyr Thr Asn His Ala Glu Met Asp Pro Asp 
210 215 220 

Ser Phe Gly Ala Glu Pro Met Leu Leu Phe Asn Asp Tyr Pro Leu Asp 
225 230 235 240 

His Pro Ala Arg Thr Trp Leu His Arg Phe Gin Ala Phe Phe Tyr Met 
245 250 255 

Pro Val Leu Ala Gly Tyr Trp Leu Ser Ala Val Phe Asn Pro Gin He 
260 265 270 



Leu Asp Leu Gin Gin Arg Gly Ala Leu Ser Val Gly He Arg Leu Asp 
275 280 285 



109 



Asn Ala Phe lie His Ser Arg Arg Lys Tyr Ala Val Plae Trp Arg Ala 
290 295 300 

Val Tyr lie Ala Val Asn Val lie Ala Pro Phe Tyr Thr Asn Ser Gly 
305 310 315 320 

Leu Glu Trp Ser Trp Arg Val Phe Gly Asn lie Met Leu Met Gly Val 
325 330 335 

Ala Glu Ser Leu Ala Leu Ala Val Leu Phe Ser Leu Ser His Asn Phe 
340 345 350 

Glu Ser Ala Asp Arg Asp Pro Thr Ala Pro Leu Lys Lys Thr Gly Glu 
355 360 365 

Pro Val Asp Trp Phe Lys Thr Gin Val Glu Thr Ser Cys Thr Tyr Gly 
370 375 380 

Gly Phe Leu Ser Gly Cys Phe Thr Gly Gly Leu Asn Phe Gin Val Glu 
385 390 395. 400 

His His Leu Phe Pro Arg Met Ser Ser Ala Trp Tyr Pro Tyr lie Ala 
405 410 415 

Pro Lys Val Arg Glu He Cys Ala Lys His Gly Val His Tyr Ala Tyr 
420 425 430 

Tyr Pro Trp He His Gin Asn Phe Leu Ser Thr Val Arg Tyr Met His 
435* 440 445 

Ala Ala^Gly Thr Gly Ala Asn Trp Arg Gin Met Ala Arg Glu Asn Pro 
450 455 460 

Leu Thr Gly Arg Ala 
465 . 



<210> 32 
<211> 26 
<212> DNA 

<213> Artificial Sequence 
<220> 

<223> Polylinker 
<400> 32 

gaattcggcg cgccgagctc ctcgag 



<210> 33 
<211> 265 
<212> DNA 

<213> Artificial Sequence 
<220> 

<2 2 3 > Polylinker-Terminator-Polyl inker 
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<400> 33 

ccaccgcggt gggcggccgc ctgcagtcta gaaggcctcc tgctttaatg agatatgcga 60 

gacgcctatg atcgcatgat atttgctttc aattctgttg tgcacgttgt aaaaaacctg 120 

agcatgtgta gctcagatcc ttaccgccgg tttcggttca ttctaatgaa tatatcaccc 180 

gttactatcg tatttttatg aataatattc tccgttcaat ttactgattg tccgtcgacg 240 
aattcgagct cggcgcgcca agctt 2 65 

<210> 34 
<211> 257 
<212> DNA 

<213> Artificial Sequence 
<220> 

<2 2 3 > Polylinker-Terminator-Polylinker 

<400> 34 ' 

ggatccgata tcgggcccgc tagcgttaac cctgctttaa tgagatatgc gagacgccta 60 
tgatcgcatg atatttgctt tcaattctgt tgtgcacgtt gtaaaaaacc tgagcatgtg 120 
tagctcagat ccttaccgcc ggtttcggtt cattctaatg aatatatcac ccgttactat ISO 
cgtattttta . tgaataatat tctccgttca atttactgat tgtccgtcga cgaattcgag 240 
ctcggcgcgc caagctt 257 

<210> 35 
<211> 257 
-<212> DNA 

<213> Artificial Sequence 

<220> 

<2 2 3 > Polylinker-Tenninator-Poly linker 

<400> 35 

agatctgccg gcatcgatcc cgggccatgg cctgctttaa tgagatatgc gagacgccta 60 
tgatcgcatg atatttgctt tcaattctgt tgtgcacgtt gtaaaaaacc tgagcatgtg 120 
tagctcagat ccttaccgcc ggtttcggtt cattctaatg aatatatcac ccgttactat 180 
cgtattttta tgaataatat tctccgttca atttactgat tgtccgtcga cgaattcgag 240 
ctcggcgcgc caagctt 257 



